实时：海天瑞声副总经理兼技术总监黄宇凯分享大模型时代下的数据机遇@天风证券策略会

3月15日，天风证券（601162）“如日方升”2023春季策略会在京举办，海天瑞声副总经理兼技术总监黄宇凯受邀参加。深入分析大模型时代下的数据机遇，并着重分享了ChatGPT等大型预训练模型的特点。

近期，ChatGPT和GPT4带来的热潮受到了全球范围的广泛关注和讨论。这股热潮带来了资本市场的再次迸发，投资者们对人工智能产业的前景充满信心。在过去几年中，人工智能领域的投资数量和规模都在不断增长。

【资料图】

同时，消费者对人工智能产业的热情也再次迸发。随着人工智能技术的不断进步，智能驾驶、智能家居、智能客服、智能安防等应用场景持续发力，让人们对人工智能技术的认知程度也在不断提高。

资本市场和消费者的热情双重迸发，为人工智能产业的未来增加了更多的可能性。海天瑞声副总经理兼技术总监黄宇凯对ChatGPT进行解读。

ChatGPT凭什么拥有超强能力？

ChatGPT作为一个具有强大的学习和自我改进能力的语言模型，可以根据用户需求和反馈生成更准确、自然和有用的回答，为用户提供更好的语言交互体验。黄宇凯从技术角度对ChatGPT的特点进行解读，主要有两大特点：参数大、PPO/强化学习。

参数大

更大的模型往往意味着更低的Loss，更好的效果，少样本学习的可能。ChatGPT模型包含数千亿个参数，使其能够从大量的语料库数据中学习到丰富的语言知识和模式。

PPO/强化学习

强化学习的引入大幅提升了大模型学习效果。ChatGPT模型使用了Proximal Policy Optimization (PPO)等强化学习技术，使其能够根据用户的反馈和交互学习和改进其回答。这种强化学习方法允许模型在面对不同的用户需求和情境时，通过不断调整其生成回答的策略，提高其回答的质量和效率。

为了进一步提高ChatGPT模型的性能，还使用了人类反馈的强化学习方法，让人类专家对ChatGPT的回答进行评估和反馈。这种反馈机制可以帮助模型识别和改正其回答中的错误和不准确之处，从而提高其对用户需求的响应能力和准确性。

大模型时代下数据需求有哪些？

大模型的训练过程需要大量的数据支持，对数据的需求主要分为三个阶段：预训练阶段、强化学习阶段和垂向拓展阶段。

Step1：预训练阶段

这个阶段中，数据的重点是多样性和覆盖面，需要海量的原始文本数据进行训练。为提升大模型的多任务泛化能力，非常重要的一步是对数据进行清洗，包括检查数据一致性、处理无效值、识别数据冲突等。只有使用大量干净、高质量的文本数据，才能够有效提升模型性能。

Step2：强化学习阶段

第二阶段需要大量的仿真数据和反馈信号，以及对数据进行增量学习和在线学习。这其中包含多样性数据集研究、指定数据集的prompt设计技术、专业领域知识、清晰的标注规则等重点和难点。

Step3：垂向拓展阶段

ChatGPT为代表的大模型给智能时代提供了强大的技术底座，但如何实现商业化价值是每个企业面临的课题与挑战。产品能力是核心，需要精准捕捉与产业相结合并产生价值的关键点。同时，产品的打磨需要行业知识，而行业知识通常是通过数据的形式来挖掘，从而更好的反哺产品创新。

数据是人工智能发展的重要基石，大模型的出现为数据需求带来了新的挑战和机遇。海天瑞声将坚持以“做智能世界的数据基石”为使命，积极与各方共同推动人工智能技术的发展和应用，促进企业数字化、智能化进程的加速推进，为建设数字经济和智能社会做出贡献。

信息 >

实时：海天瑞声副总经理兼技术总监黄宇凯分享大模型时代下的数据机遇@天风证券策略会

频道精选

最新资讯