最近我正在由Andrew Ng教授在Coursera学习机器学习课程 . 完成本课程后,我了解了机器学习算法的基础知识,但我有以下问题:
我在哪里可以找到真实世界的机器学习用例?
工业/ 生产环境 机器中使用了哪些工具或框架学习项目?
如何在 生产环境 中使用或部署机器学习模型?
如何成为数据科学家?或者接下来我该怎么办?
任何建议,书籍,课程或教程链接将受到高度赞赏 .
恭喜Andrew Ng完成机器学习课程,有时候我也做了这个很棒的课程 . 无论如何,所以我将逐一回答你的问题,尽管很少有相关的问题 .
Q-1) Where can i find the Real world Machine Learning use case examples?
以下是一些链接,您可以在其中找到使用真实世界用例的机器学习教程:
Tutorials on real world Machine Learning Case Studies
机器学习示例Scikit学习:http://scikit-learn.org/stable/tutorial/basic/tutorial.html
机器学习教程GraphLab:https://dato.com/learn/gallery/
Q-2) What tools or framework are used in Industry/Production for Machine Learning projects?
工业级中使用的工具或框架种类繁多,如:
R.
Python(Sci-kit学习)
GraphLab
Apache Mahout
Spark MLlib
虽然R,Scikit了解到,GraphLab在数据科学家或机器学习实践者的单机和最受欢迎的选择中运行良好,但Mahout和最近的Spark MLlib在 Big Data 的时代已经获得了很多人气,在那里你想要机器学习大型数据集,不适合单台机器 .
还有一些其他工具,如Weka,Rapid Miner,用于基于GUI的机器学习工作流程 .
这个工具或框架的选择实际上取决于项目要求,团队成员对工具/语言的了解,易于开发和部署的可扩展性等因素 .
Q-3) How Machine Learning models are used or deploy in production?
在生成模型,生成模型,验证和评估该模型之后的 生产环境 中,模型最常部署为Web服务以供其他应用程序使用 . 有一些基于 Cloud 的机器学习服务提供商,如Azure ML(https://studio.azureml.net/)BigML(https://bigml.com/)等,您可以在其中上传数据集,进行一些数据处理,培训|验证|评估您的机器学习模型,然后最终将其部署为webservice in Cloud 端 .
Note: 最近我在Github (Predictive Analytics Service)开始了一个项目,该项目旨在使用不同的工具/框架作为Web服务开发和部署各种机器学习模型 . 我们热烈欢迎您的贡献和建议 .
Q-4) How to become Data Scientist? Or What should i do next?
这是一个百万美元的问题和很多谷歌搜索这个问题..哈哈..我会尽量根据我的知识给你一个简短的答案 . 首先,数据科学是一个更广泛的研究领域,包括以下常见步骤:
业务理解或质疑阶段
数据收集或获取
数据处理和准备
模型建筑
验证和评估
除此之外,您还需要根据数据变化的变化进行模型再处理,或者您可以部署在线学习模型(它将根据它看到的数据进行自我调整) .
但任何人成为数据科学家/机器学习实践者的基本要素都是对数据的宽容(即理解数据并从中找到可用的知识) . 既没有成为数据科学家的捷径,也没有任何课程可以让你在一夜之间成为数据科学家 . Best way is to play with data or do some real world projects.
大量现实世界数据集可公开获取,您可以选择您感兴趣的数据集 . 您还可以通过参加机器学习和数据科学竞赛 Kaggle 来测试您的技能和专业知识 .
要获得一些关于数据科学的知识,以及它如何与一些练习一起工作,你可以尝试在线课程,如:
https://www.coursera.org/specializations/machine-learning
https://www.edx.org/course/introduction-computational-thinking-data-mitx-6-00-2x-2
https://www.edx.org/course/data-science-machine-learning-essentials-microsoft-dat203x
1 回答
恭喜Andrew Ng完成机器学习课程,有时候我也做了这个很棒的课程 . 无论如何,所以我将逐一回答你的问题,尽管很少有相关的问题 .
Q-1) Where can i find the Real world Machine Learning use case examples?
以下是一些链接,您可以在其中找到使用真实世界用例的机器学习教程:
Tutorials on real world Machine Learning Case Studies
机器学习示例Scikit学习:http://scikit-learn.org/stable/tutorial/basic/tutorial.html
机器学习教程GraphLab:https://dato.com/learn/gallery/
Q-2) What tools or framework are used in Industry/Production for Machine Learning projects?
工业级中使用的工具或框架种类繁多,如:
R.
Python(Sci-kit学习)
GraphLab
Apache Mahout
Spark MLlib
虽然R,Scikit了解到,GraphLab在数据科学家或机器学习实践者的单机和最受欢迎的选择中运行良好,但Mahout和最近的Spark MLlib在 Big Data 的时代已经获得了很多人气,在那里你想要机器学习大型数据集,不适合单台机器 .
还有一些其他工具,如Weka,Rapid Miner,用于基于GUI的机器学习工作流程 .
这个工具或框架的选择实际上取决于项目要求,团队成员对工具/语言的了解,易于开发和部署的可扩展性等因素 .
Q-3) How Machine Learning models are used or deploy in production?
在生成模型,生成模型,验证和评估该模型之后的 生产环境 中,模型最常部署为Web服务以供其他应用程序使用 . 有一些基于 Cloud 的机器学习服务提供商,如Azure ML(https://studio.azureml.net/)BigML(https://bigml.com/)等,您可以在其中上传数据集,进行一些数据处理,培训|验证|评估您的机器学习模型,然后最终将其部署为webservice in Cloud 端 .
Note: 最近我在Github (Predictive Analytics Service)开始了一个项目,该项目旨在使用不同的工具/框架作为Web服务开发和部署各种机器学习模型 . 我们热烈欢迎您的贡献和建议 .
Q-4) How to become Data Scientist? Or What should i do next?
这是一个百万美元的问题和很多谷歌搜索这个问题..哈哈..我会尽量根据我的知识给你一个简短的答案 . 首先,数据科学是一个更广泛的研究领域,包括以下常见步骤:
业务理解或质疑阶段
数据收集或获取
数据处理和准备
模型建筑
验证和评估
除此之外,您还需要根据数据变化的变化进行模型再处理,或者您可以部署在线学习模型(它将根据它看到的数据进行自我调整) .
但任何人成为数据科学家/机器学习实践者的基本要素都是对数据的宽容(即理解数据并从中找到可用的知识) . 既没有成为数据科学家的捷径,也没有任何课程可以让你在一夜之间成为数据科学家 . Best way is to play with data or do some real world projects.
大量现实世界数据集可公开获取,您可以选择您感兴趣的数据集 . 您还可以通过参加机器学习和数据科学竞赛 Kaggle 来测试您的技能和专业知识 .
要获得一些关于数据科学的知识,以及它如何与一些练习一起工作,你可以尝试在线课程,如:
https://www.coursera.org/specializations/machine-learning
https://www.edx.org/course/introduction-computational-thinking-data-mitx-6-00-2x-2
https://www.edx.org/course/data-science-machine-learning-essentials-microsoft-dat203x