随着硬件计算能力的提高和数字存储能力的增强,人工智能技术在学术界和商业界都进入了一个新的发展阶段。2022年末ChatGPT的问世,更是成为了人工智能发展的标志性事件。ChatGPT不仅意味着人工智能迈向了更高层次更加通用的智能水平,以其为基础的AICG(AI Generated Content,人工智能自动生成内容)更是成为了近期各界都竞相追捧的热门领域。而在投资人和商业巨头们为了ChatGPT争相竞赛、大打出手的同时,其对科研工作者产生的影响同样不容小觑,对科研人员来说,既是机遇,也存在着诸多挑战。
顶刊"Nature"近期更是连发两文,探讨了ChatGPT对于学术界当前的影响,提出了一些可能的应对措施。本文将结合近期各界对ChatGPT的研究和讨论,探讨ChatGPT对科研工作者带来的机遇与挑战,欢迎各位读者指正。


图源:Nature官网
ChatGPT作为一种大型语言模型(large language model,LLM),能够自主地从机器中学习,并可以在对大量文本和数据集进行训练后与用户进行自然交互,且能够实现“回答后续问题、承认错误、质疑不正确的前提和拒绝不适当请求”的能力。
通常科研人员需要花费大量的时间来进行文献查找、实验数据分析、报告撰写等工作,而ChatGPT可以快速地从海量的文献数据库中查找相关信息,加速科研人员的研究进程。此外,ChatGPT还可以自动化实验设计和数据分析过程,帮助研究人员更快地获取实验数据并进行下一步的科学研究。自ChatGPT问世以来,已经有越来越多的研究人员开始使用它来撰写文献综述、论文草稿、查找实验设计中的漏洞甚至是润色论文,而这将大大缩短学者们花在查找文献、撰写文献综述、对比总结等基础工作上的时间,缩短科研成果发表所需的时间,从而显著地提升研究人员的工作效率。
因ChatGPT能够使科研工作者更为流利地写作,并且提升其科研的效率,由此带来的直接影响就是加速科研工作者们的创新过程。在基础繁琐的工作部分被AI替代后,学者们得以有更多的时间专注于设计新的实验、研究新的课题,也就有可能产生更多的科研突破。
早在1911年,就有开创性的研究论文指出,人类与智能技术之间的“智能合作伙伴关系”可以胜过单独的人的智力,时至今日,ChatGPT的横空出世已经预示着研究者所言的这些智能伙伴关系很可能会超越人类的能力,并将科研领域的创新推进到以前无法想象的水平。基于其自然语言处理和深度学习的技术,ChatGPT也能够为研究人员开拓新的研究领域提供支持。例如,在医学领域,ChatGPT可以协助医生进行诊断和治疗决策,并为药物研发提供支持;在生物领域,ChatGPT可以帮助研究人员进行基因编辑和DNA测序等方面的研究;此外,ChatGPT还可以与其他技术,如计算机视觉和机器人技术等结合使用,为各个领域的研究提供更加全面的支持,并为跨学科研究提供桥梁,促进不同学科之间的相互理解和合作。
作为一个可以令人信服地用英语和其他语言就自然科学、社会学等广泛的话题与用户进行交互的模型,ChatGPT不仅有免费版本,而且易于获取,易用性也很强。若能做到恰当使用,ChatGPT能够有助于创造公平的学术氛围,例如它能够帮助学者们消除语言障碍,使得更多研究做得好的科学家也能写出更高质量的学术文本。对科研工作来讲,ChatGPT可以说是一个丰富强大的资源库,总体而言其能提供如下几个方面的辅助:
ChatGPT可以从大量的文献数据库中搜索和整理相关文献资料,使得研究人员可以更加迅速地找到自己需要的相关文献资料。
ChatGPT可以整理和处理来自各种不同来源的数据集,包括开放数据集、专利数据库、基因序列数据等。
ChatGPT可以帮助研究人员自动化实验设计和数据分析过程,提高研究效率和数据准确性。在实验设计方面,ChatGPT可以根据研究人员提供的信息和目标,自动生成一系列实验方案,并根据反馈不断优化实验设计。在数据分析方面,ChatGPT可以处理大规模的数据集、提供有效的数据可视化和统计分析、自动检测异常值和数据质量问题。
ChatGPT可以用于自然语言处理,例如自动翻译、语音识别、问答系统等。这些技术可以帮助科研工作者快速处理和分析大量的文本数据,协助研究人员润色论文,并进行语法、拼写、标点等方面的自动校对。此外,ChatGPT还可以提供适当的建议,使论文更加清晰、简洁、具有说服力。
二、将ChatGPT作为“科研助手”有哪些风险和挑战?
作为对话式的AI,尽管ChatGPT有足够的潜力成为一个良好的“科研助理”,参与研究过程中的多个阶段并提供帮助,但正因如此,科研工作者研究过程的透明度和质量则有可能被降低。Nature发表评论文章指出:“ChatGPT和其他大型语言模型生成的文本令人信服,但往往是错误的,因此使用它们会歪曲科学事实并传播错误信息。”
有学者向ChatGPT提问发现,对于一些需要进一步了解文献或深入调查的问题,ChatGPT经常会生成虚假和带有误导性的文本,这些文本可能乍一看是令人信服且有理有据的,实则经不起进一步的推敲和验证,对研究者提问的错误回答包含几个事实错误、虚假陈述和错误数据。产生此类错误回答的原因可能是由于ChatGPT的训练数据集里缺少与提问主题相关的文章,因此ChatGPT未能提炼出相关的信息或无法区分信息来源是否可信所导致的。但此类问题的存在充分说明了将对话式的AI用作专门的学术研究有可能会导致事实错误,加深研究者对某一问题的偏见甚至让研究人员偏离正确的研究方向。如果研究者被ChatGPT生成的具有华丽辞藻的答案迷惑,将错误信息融入科研成果中并发表,那么对学术界将是一场灾难。
尽管目前学界普遍认为AI不能成为学术论文的作者,因为AI不能对其生成的内容负责,但是随着很多科研人员让AI在研究过程中的参与程度越来越高,在某些情况下,ChatGPT甚至可能会根据研究者的引导和提示完成一篇学术文章的重要部分。这种情况下,就很难界定科研人员和AI各自对研究成果的参与度和贡献度,且由于目前审查制度和程序的局限性,审稿人或专门设计的审查程序很有可能无法完整或准确识别科研人员是否以及在何种程度上使用了ChatGPT,这一问题将会对科研成果原创性的认定提出挑战。此外,这些在原创性、作者身份认定、引用信息来源等方面的模糊性,也可能为学术不端行为的滋生提供了土壤。此前一些欧美高校禁止学生在学术论文或课程作业中使用ChatGPT就充分证明了这一问题的重要性和紧迫性。
ChatGPT有可能改变人类作为科研人员的自主权:科研人员一旦享受过ChatGPT所带来的便利后,很有可能会开始逐渐依赖这一技术。研究者们有了ChatGPT辅助后,对文献检索、数据统计与分析等领域的能力要求或许会降低甚至逐渐丧失。学者在上述这些领域的能力退化或许不是至关重要的,也并不会对科技进步产生致命的影响,但是作为科研工作者,仍然有很大一部分技能如提出想法、设计实验并实践、撰写论文发表成果等是至关重要的。如果一味地让AI代替学者完成越来越多的工作,随着AI进一步进化,那么研究者对学术成果的个人贡献可能会更加有限和模糊,甚至在这些环节之外,那些对于科研工作乃至是人类社会都极为重要的原则:好奇心、想象力、创造力、思考和判断能力、诚信等理念也会面临考验。尽管目前我们距离这种情况还相对比较遥远,但毫无疑问,如何保证科研人员的创造力不退化也是学术界需要面对的重要课题。
鉴于ChatGPT能够为科研工作带来的巨大便利,当下,科研人员对ChatGPT的使用已成为不可避免的趋势,学术圈想要禁止或避免对这项技术的使用几乎是不可能的。然而,放任科研人员对ChatGPT不加节制的使用也是不可取的,未来应当坚持对科研成果进行严格审查,甚至考虑增加专门的环节来验证ChatGPT的参与度及其所贡献信息的准确性,始终坚持科研人员对科研成果负责的原则和理念,保证科研过程的透明度。
学界应当积极把握机遇并恰当管理风险,从一线的科研人员到高校再到学术成果的出版发行方,科研工作中的每一个参与者都应当负起属于自己的责任,正如陀思妥耶夫斯基所言:“每个人都对世间的人事万物负有责任”,相信科学终会找到一种方法,从对话式AI中获益。
原创作者:
张天宇
参考资料:
1.Eva A. M. van Dis. ChatGPT: five priorities for research. Nature 614, 224-226 (2023).
2.Chris Stokel-Walker. ChatGPT listed as author on research papers: many scientists disapprove. Nature 613, 620-621 (2023)
3.Salomon, G., Perkins, D. N. & Globerson, T. Edu. Res. 20, 2–9 (1991).