训练数据是指用于训练 AI 模型或机器学习算法,使其做出正确判断的已标注数据。
举例来说,如果您想要为自动驾驶汽车建立模型,则训练数据将会包含已标记的图像和视频,用以识别汽车、街道标志和人群。如果您要创建一个客服聊天机器人,则训练数据的文本和音频可能会以各种不同的方式询问“我的帐户余额是多少?”,然后将其翻译成不同的语言。
训练数据对于任何 AI 模型或项目的成功而言都至关重要。我们试想“garbage in, garbage out”这个道理:如果您用质量差的数据训练模型,那么如何期望模型能够表现完美?肯定不会,也永远不会。
您可能拥有最合适的算法,但是如果使用不恰当的数据对机器进行训练,那么机器就会被错误引导、也就无法达到预期,也无法按您(或客户)的期望运行。因此,成功与否几乎完全取决于您的数据质量。