来源:开源中国 时间:2023-08-26 12:38:50
(资料图片仅供参考)
8 月 26 日「源创会」北京站,聊聊 AI 大模型与底层技术 >>>据百度官方消息, 日前位于海口市秀英区的百度智能云(海口)人工智能基础数据产业基地正式启动运营,这是百度智能云与海口市政府合作共建的国内首个大模型数据标注中心。
百度智能云方面表示,目前已经在全国与各地政府合作,共建了十多个数据标注基地,累计为当地提供超过1.1万个稳定就业岗位,间接带动5万人就业。
为保障数据标注质量,百度智能云还搭建了全流程数据服务人才梯队。海口数据标注基地现拥有数百名专职大模型数据标注师,标注师的本科率达到100%。
“和传统的数据标注师要求不同,大模型标注师都需要本科以上学历,我觉得主要是因为大模型数据涉及的知识面很广,评判标准复杂,非常考验标注师的语言理解能力和逻辑推理能力。在入职的前两个月,公司会对我们进行集体培训和考核,通过考核后才能正式上岗。”百度智能云大模型数据标注师王洁玉说。
当前,大模型正处在产业落地前期,高质量的数据,是大模型实现产业化的关键要素。对于以ChatGPT、文心一言为代表的生成式AI,海量的数据训练、人工标注、指令微调、基于人类反馈的强化学习(RLHF),可以让大模型与人类价值观、思维方式不断对齐,使大模型更加可用。