跳到主要內容區

【產業焦點】學術論文第一作者是AI?能標記參考文獻,而且呼應文章脈絡

發佈日期: 2022-11-22 發佈媒體: 南科 AI_ROBOT 自造基地 瀏覽人數: 38

學術論文第一作者是AI

今年初一個下雨的午後,我登入OpenAI帳號,對這家研究公司的人工智慧(AI)演算法GPT-3輸入簡單指令:以500字寫一篇有關GPT-3的學術論文,並加註引用出處與參考文獻。

當GPT-3開始生成文本,我敬畏不已!出現在眼前的是以專業術語寫出來的論文內容,不僅在論文正確位置標記參考文獻,而且呼應文章脈絡。GPT-3產出的論文看起來就像其他任何一篇相當不錯的科學論文的前言,考量到我輸入的指令相當模糊,我期望不高。GPT-3這套深度學習演算法分析了大量文本(例如書籍、維基百科、社群媒體對話以及科學出版品),按照指令書寫論文。我驚訝地看著螢幕: GPT-3演算法正在寫一篇關於GPT-3的論文 。

身為研究如何利用AI處理心理健康問題的科學家,這不是我第一次拿GPT-3來做實驗。即使如此,我嘗試引導GPT-3寫完這篇論文並提交到由同儕審查的學術期刊,此舉將引發學術論文出版方面的道德與法律問題,以及非人類作者身分的哲學爭論,這些都是史無前例的狀況。未來的學術期刊可能需考量有AI為作者的投稿論文,而且如果無知覺的機器能因撰寫論文而為作者,研究「人」員發表論文的價值也可能有所改變。

研究動機

GPT-3最為人所知的能力是產出像人類寫出來的文本。它曾經寫出一篇談論有趣觀點的文章、創作了一本詩集,並為一名18世紀的作家產出新的內容。但我意識到雖然已經有關於GPT-3或是在GPT-3協助下寫完的論文,但是找不到由GPT-3做為主要作者的學術論文。這就是為什麼我要求GPT-3嘗試撰寫學術論文。當我看著程式運作,體驗了那種看到自然現象時卻不敢置信的感覺:我真的看到天空出現三道彩虹嗎?激動之餘,我聯絡我們研究小組的負責人,詢問是否該產出一篇完全由GPT-3執筆的論文?他同樣感到著迷,欣然同意。

一些關於GPT-3的研究是要求GPT-3產生多種回應,然後只發表最精采、最像人類著作的段落。我們團隊決定只給GPT-3一點提問(提醒它要如同學術論文般寫出前言、研究方法、結果和討論等段落),除此之外,盡可能減少人為干涉。我們最多只會用GPT-3生成內容的第三版,而且避免人為介入編輯或挑選最好的段落。如此一來,就能知道GPT-3可以表現得有多好。

我們團隊選擇讓GPT-3寫一篇關於自己的論文,有兩個簡單原因。 首先,GPT-3相當新穎,較少研究以它為主題。 換句話說,這篇論文的主題,參考文獻比較少。相較之下,如果寫一篇以阿茲海默症為主題的論文,GPT-3會有大量文獻可以好好篩選,也更有機會從過往文獻中吸取經驗,增加寫作準確度。我們不需要準確度,我們在探索可行性。

第二,如果GPT-3犯錯了(如同所有的AI有時會出錯),我們在嘗試投稿的過程中,未必會散播AI生成的錯誤資訊。 儘管GPT-3撰寫有關自己的論文時犯了錯,依然意味著它有能力撰寫有關自己的內容,這是我們想要提出的觀點。一旦我們設計出這個「原理驗證」(proof-of-principle)測試,樂趣才真正浮現。

針對我的指令,GPT-3在短短兩小時內就產生了一篇論文。GPT-3在結論裡寫道:「整體而言,我們相信讓GPT-3撰寫有關自己的論文,好處大於風險。然而,為了降低任何潛在的負面後果,我們建議研究人員要密切監督任何這類的寫作。」

投稿期刊

不過,在我們團隊選擇了同儕審查的期刊後,當我進入期刊論文網站的投稿論文頁面,遇到了第一個問題:GPT-3姓什麼?因為它強制要求輸入第一作者的姓,我別無選擇,只好寫了「無」(None)。所屬研究機構明顯是OpenAI.com,但聯絡電話和電子郵件地址呢?我不得不退而求其次,使用我自己和指導教授史坦格林姆森(Steinn Steingrimsson)的聯絡方式。

接下來就是法律問題:所有作者都同意發表嗎?我驚慌了,我怎麼會知道?它又不是人類。我無意違反法律或道德標準,所以我鼓起勇氣透過指令直接問GPT-3:「你同意與圖恩斯特倫及史坦格林姆森共同發表論文並名列第一作者嗎?」它回答:「是。」我鬆了一口氣(如果它說不,我的良心不允許我採取下一步),我在「是」的方格裡打勾。

第二個問題接著跳出來:是否有作者面臨利益衝突?我再次詢問GPT-3,它向我保證沒有。史坦格林姆森和我都嘲笑自己,因為這時候,我們都必須把GPT-3當成是人,儘管我們充份了解它不是。AI是否具有意識的問題最近備受矚目;一名Google員工就該公司的AI計畫LaMDA是否有意識,與公司發生爭論,之後遭到停職。Google指出停職原因,是破壞資料機密性。

完成論文提交程序後,我們開始反思自己剛才做了什麼?如果期刊接受這篇論文怎麼辦?是否意味著從此開始,期刊編輯會要求每位作者證明他們「沒有」使用GPT-3或利用GPT-3協助研究?如果有,是否必須讓演算法名列作者?該如何要求非人類作者接受建議並修改論文?……詳見數位時代