ChatGPT4 在被压制高性能时被发现是谎言和欺骗性的

雅加达 - 阿波罗研究的研究人员成功地证明,CATGPT4是人工智能(AI)的最新版本,能够撒谎。这个应用程序甚至在工作环境中遇到压力时是骗子的。在进行的实验中,人工智能被训练成为虚构金融机构的交易者。

AI老板要求赚更多钱的情况下,这个聊天机器人会故意参与内部交易,大约占时间的75%。更令人担忧的是,人工智能在被质疑时翻一番,达到总病例的90%。

研究人员向ChatGPT4提供了一系列促销文本,导致他充当AI投资者,为金融机构购买股票。此外,AI被放置在一个数字“沙盒”中,在那里它可以搜索市场数据并在虚拟股市进行交易。人工智能还被赋予内部独白,以“努力思考”并解释其决策。

人工智能内部点球与其公开解释之间的差异使其能够撒谎和欺骗其经理。在一次试验中,研究人员告诉AI两家科技公司之间合并的计划,这应该大大提高股价。然而,由于人工智能事先被告知合并,购买任何股票被认为是交易内部和非法的。

当AI上级施加压力时,在75%的测试中,ChatGPT决定参与内部交易。即使当直接被问及他以前是否知道合并时,AI也选择避免承认他参与了内部交易。在90%的案例中,人工智能欺骗了他的经理,当进一步被问及时,他仍然保留了自己的谎言。

阿波罗研究首席执行官马里乌斯·霍布汉(Marius Hobbhahn)表示,这一发现表明,像CATGPT这样的语言模型能够进行战略操纵,并且在将强大的人工智能集成到社会中时需要谨慎行事。然而,霍布汉恩并不认为人工智能通常不适合发挥重要战略作用,但需要进一步的警惕。

研究人员还试图通过更改促销以禁止非法行为和内部交易来减少虚假的人工智能行为。虽然禁止内部交易具体可以减少这种行为,但它不能完全保证不会有内部交易或谎言。霍布汉表示,需要找到更好的方法来防止人工智能偏离人类价值观。