研究发现:AI聊天机器人变得越强就越有可能胡说八道
科技IT 2024-10-06 user15688
9月26日消息,据外媒报道,经过对三个主流AI聊天机器人的升级和扩展版本的研究,发现这些机器人更倾向于提供错误答案,而不是承认自己的无知。评估还揭示了人们在识别这些错误答案方面的不足。
大模型作为驱动聊天机器人的核心,有时会出错或对查询产生奇怪的“幻觉”反应。西班牙瓦伦西亚人工智能研究所的José Hernández-Orallo及其同事对这些错误进行了深入分析,以观察随着模型规模的增大――使用更多的训练数据、涉及更多的参数或决策节点并消耗更多的计算能力――这些错误是如何变化的。他们还探讨了错误的可能性是否与人对问题难度的感知相匹配,以及人们识别错误答案的能力如何。这项研究于9月25日发表在《自然》杂志上。
该团队发现,正如预期的那样,更大、更精细的LLM版本由于采用了诸如基于人类反馈的强化学习等微调方法,变得更加准确。这是个好消息。但它们变得不那么可靠:在所有不准确的回答中,错误答案的比例有所增加,团队报告称,因为模型不太可能避免回答问题,例如,通过说他们不知道,或者改变话题。
“如今它们几乎回答所有问题。这意味着更多正确的答案,但也有更多不正确的答案。”Hernández-Orallo说。
The End
相关阅读
- 西派集团携手Fastems 打造高端能源阀门制造“智能梦工厂”
- 逐点半导体与网易《逆水寒》手游就移动端视觉处理优化达成合作
- 破局不确定性,SENSOR CHINA 2024解锁产业发展新机遇
- 芯原与新基讯联合推出5G RedCap/4G LTE双模调制解调器解决方案
- 英特尔携手爱立信引领开放式网络转型
- 从观云与安云来看基调听云如何深度赋能企业数字化转型
- 比特周报:国内首个汽车大模型标准发布,OpenAI或发布ChatGPT搜索引擎
- 华为与巴基斯坦Ufone联合创新微波SuperHub方案,荣获GSMA GLOMO“最佳新兴市场移动创新奖”
- 比特网早报:华为2024全年销售收入超8600亿元,苹果M5开始量产
- 国能灵武电厂磁悬浮飞轮储能性能试验检测项目完成