机器学习如何工作?
在传统编程中,计算机系统遵循指令(算法)并执行特定任务。
在机器学习中,你为系统提供一组训练数据和一个期望的结果或要执行的任务。然后,系统会自行决定要做什么,随着时间的推移,它会在该特定任务上表现得更好,从而不断自我改进。
例如,假设你想创建一个可以识别图片中狗的图像WhatsApp数据 识别模型。在传统编程中,你会告诉软件要寻找什么——四条腿、两 开展更 只耳朵等等。在机器学习中,它会自己学习识别狗。
当算法能够很好地识别原始数据集中的狗时,您可以向它展示一组随机的新图像。如果训练成功,它现在应该能够识别从未见过的图像中的狗。
实现这一切主要有四个步骤。
步骤 1:数据收集
第一步是收集和准备用于训练机器学习模型的数据。这可以是任何形式的数据,如图片、统计数据、帖子(以前称为推文)等,具体取决于您想要实现的目标。
数据需要与任务相关,并经过准备以便机器学习程序能够理解(称为预处理)。如果您正在开发一种识别狗的工具,则需要为模型提供大量图像,一些是狗的图像,一些不是。
您还需要将数据格式化为适合您所用模型的 品牌社区比部落营销带来更多好处吗 正确电子表格或数据库。您应该清理数据- 删除所有重复项、更正错误并根据模型的要求规范化数据。
此步骤可确保您的机器学习模型能够理解任务并正确解释数据。如果不准备数据,模型可能会产生不正确的结果。
例如,如果你给它一堆猫的图像,但它们的标 购买线索 签是错误的,而模型认为它们是狗,它就会训练自己识别错误的图像。
错误的预测可能会带来严重后果,尤其是 开展更 当您使用算法分析机密的医疗保健信息或敏感的销售数据时。此外,如果算法训练不佳,则需要重新训练和重新测试,从而增加其总体成本。
第 2 步:模型选择
做好准备后,您需要为手头的工作选择正确的机器学习模型。
花时间研究每个模型。每个模型都使用不同的算法以不同的方式解决不同的问题。考虑每个模型的复杂程度以及运行所需的计算能力也很重要。复杂的模型通常需要更多的训练时间、处理能力和内存,从而增加开发成本。
如果您希望模型对数据进行分 开展更 类和标记,您可能需要选择线性回归模型。而如果您希望它对某些类型的数据进行聚类,则可以使用 K 均值模型。
我们将在下面更详细地解释机器学习算法的差异。