虽然西弗吉尼亚大学的研究人员看到了最新的官方 ChatGPT 插件(称为 Code Interpreter)在教育环境中的潜力,但他们发现科学家使用该插件的局限性,这些科学家利用计算方法处理生物数据来优先考虑癌症和遗传性疾病的针对性治疗。
“Code Interpreter 是一件好事,它在教育环境中很有帮助,因为它使学生更容易接触到 STEM 领域的编码,”西弗吉尼亚大学微生物学、免疫 学和细胞生物学系助理教授Gangqing “Michael” Hu说医学院生物信息学核心主任。“但是,它不具备生物信息学所需的功能。这些都是可以克服的技术问题。Code Interpreter的未来发展很可能将其用途扩展到生物信息学、金融和经济学等许多领域。”
自 2022 年 12 月发布以来,热门人工智能聊天机器人 ChatGPT 获得了企业、教育工作者和公众的关注。然而,它并没有完全满足生物医学研究人员的需求,包括生物信息学(计算机科学与生物学相遇的领域),他们热切地等待 OpenAI 的代码解释器插件,希望它能够填补空白。
Hu 和他的团队在各种任务上对 Code Interpreter 进行了测试,以评估其功能。他们的研究结果发表在生物医学工程年鉴上,表明该插件打破了一些障碍,但不是全部。
例如,没有科学背景的人可以使用代码解释器轻松地进行编码或计算机编程。胡说,这也具有成本效益,并激发学生探索数据分析的好奇心,提高他们的学习兴趣。不过,他指出,用户需要了解如何解释数据并识别结果是否准确,并知道如何与聊天机器人交互。
生物信息学家依靠精确的编码、计算机软件程序和互联网访问来存储、分析和解释生物数据,例如用于现代医学进步的 DNA 和人类基因组。
Hu 说,尽管需要针对生物信息学进行改进,但 Code Interpreter 可以帮助用户确定响应是否准确,或者是否是自信地提出的虚构答案(称为幻觉)。
“人们知道 ChatGPT 可以做许多令人印象深刻的事情,但它不擅长提供引用或参考来支持其答案。如果被问及支持回应主张的来源,它可能会开始编造参考资料,”胡解释道。“代码解释器提供了一种最小化幻觉的解决方案。对于可以通过编码解决的问题,代码本身可以作为来源或引用。这是向前迈出的重要一步。”
与胡一起工作的还有西弗吉尼亚大学微生物学、免疫学和细胞生物学系的博士后王磊;葛希金,南达科他州立大学;和亚利桑那州立大学的Li Liu。