亚洲婷婷免费_区一区二区三区中文字幕_欧美做受高潮电影o_日韩av电影免费在线_国产精品麻豆入口_无码国产精品96久久久久_99热在线免费_成人性生交大片免费看午夜_成人高清av_欧美三级免费

30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了

前沿科技 3年前 (2022) 虛像
9 0 0

機器之心報道

編輯:澤南、小舟

不增加算力需求,谷歌總結的指令微調方法能讓 8000 萬到 5400 億參數的模型都顯著提升性能。

人工智能一個重要的目標是開發泛化能力強的模型。在自然語言處理(NLP)領域中,預訓練語言模型在這方面取得了重大進展。這類模型往往通過微調來適應新的任務。

近日,來自谷歌的研究者分析了多種指令微調方法,包括擴展對指令微調的影響。實驗表明,指令微調確實可以根據任務數量和模型大小實現良好的擴展,最大到 5400 億參數的模型都能明顯受益,未來的研究應該進一步擴大任務的數量和模型的大小。此外,該研究還分析了微調對模型執行推理能力的影響,結果都是很吸引人的。

由此產生的 Flan-T5 對 1800 余種語言任務進行了指令微調,明顯提高了提示和多步推理能力,30 億參數跑基準就能超過 GPT-3 的 1750 億參數。

30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了

看起來谷歌又為大模型找到了一個能力提升的方向。不過這一研究不僅引來了機器學習社區的歡迎,也有 Gary Marcus 的吐槽:

30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了

谷歌的模型為什么把谷歌自己的著名科學家 Geoffrey Hinton 的出生日期搞錯了?人家明明是 1947 年出生的老前輩。

論文作者之一的谷歌大腦首席科學家 Quoc Le 趕緊出來圓場:是臨時工圖片做錯了,在論文里 Flan-T5 模型其實沒有把 Geoff 的出生年月搞錯,有圖為證。

30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了

順便說一句,出生于 1963 年的著名 AI 學者是 Jürgen Schmidhuber。

既然出錯的不是 AI 模型,讓我們看看谷歌的新方法究竟能夠為預訓練模型帶來哪些改變吧。

論文:Scaling Instruction-Finetuned Language Models

30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了

論文地址:https://arxiv.org/abs/2210.11416

公開模型:https://github.com/google-research/t5x/blob/main/docs/models.md#flan-t5-checkpoints

該研究使用 540B 參數模型訓練 Flan-PaLM,將微調任務的數量增加到 1800 個以上,并包含思維鏈(CoT;Wei et al., 2022b)數據。經過訓練后的 Flan-PaLM 優于 PaLM,在多個基準測試中達到了新的 SOTA。在推理能力方面,Flan-PaLM 能夠利用 CoT 和自洽性(self-consistency;Wang et al., 2022c)在大規模多任務語言理解(MMLU; Hendrycks et al., 2020)上實現 75.2% 的準確率。

30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了

此外,在一組具有挑戰性的開放式生成問題上,Flan-PaLM 的表現明顯優于 PaLM,可用性大幅提高。

總體而言,谷歌的這項研究闡明了使用指令微調來提高模型性能的具體方法。

方法

具體來說,該研究主要關注影響指令微調的幾個方面,包括:(1)擴展任務數量,(2)擴展模型大小,以及(3)對思維鏈數據進行微調。

該研究發現具有上述方面的指令微調顯著改進了各種模型類(PaLM、T5、U-PaLM)、prompting 設置(零樣本、少樣本、CoT)和評估基準(MMLU、BBH、 TyDiQA、MGSM、開放式生成)。例如,在 1.8K 任務上進行指令微調的 Flan-PaLM 540B 大大優于 PALM 540B(平均 + 9.4%)。Flan-PaLM 540B 在幾個基準測試中實現了最先進的性能,例如在五次 MMLU 上達到 75.2%。

研究者還公開了 Flan-T5 檢查點,即使與更大的模型(例如 PaLM 62B)相比,它也能實現強大的少樣本性能。總體而言,指令微調是提高預訓練語言模型的性能和可用性的通用方法。

30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了

圖 1. 研究人員在 1800 余個任務中對各種語言模型進行了微調,在有 / 缺乏樣本(零樣本和少樣本)以及有 / 沒有思維鏈的情況下進行微調,從而能夠在一系列評估場景中進行泛化。

30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了

圖 2. 微調數據包括 473 個數據集、146 個任務類別和共計 1836 個任務。

30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了

在數據微調和程序微調過程完成后,研究者根據模型大小對任務的性能來對比規模擴展的影響。首先,對于所有三種模型大小,多任務指令微調與沒有微調相比性能有很大提高,增益范圍從 9.4% 到 15.5%。其次,增加微調任務的數量可以提高性能。

最后,我們可以看到將模型規模增加一個數量級(8B → 62B 或 62B → 540B)可以明顯提高微調和未微調模型的性能。

30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了

多任務指令微調相對于模型大小(參數量)和微調任務數量及規模擴展對準確率的影響。

30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了

增加微調數據中的任務數量可以提高 Flan-PaLM 在大多數評估基準上的性能。

研究人員證明了在微調混合中包含九個帶有思維鏈 ( CoT ) 注釋的數據集可以提高推理能力。下表顯示 Flan-PaLM 的 CoT 提示能力在四個保留的評估基準上優于 PaLM。

30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了

該研究發現對 CoT 數據進行指令微調的另外一個好處是可以實現零樣本(zero-shot)推理,模型在沒有針對 CoT 的少量樣本的情況下就自行產生了推理能力,這可能需要大量工程調教才能正確實現。

30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了

圖 6:PaLM 和 Flan-PaLM 在一組 23 個具有挑戰性的 BIG-Bench 任務 ( BBH ) 上的 zero-shot 性能。Flan-PaLM 需要通過「讓我們一步一步思考」指令激活的思想鏈 ( CoT ) 生成。

為了展示新方法的通用性,谷歌訓練了 T5、PaLM 和 U-PaLM,涵蓋了從 8000 萬到 5400 億參數的模型體量范圍,發現所有模型都能大幅提升性能。

30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了

表 5. 指令微調 ( Flan ) 在其他持續預訓練方法之上提高了性能。

經過測試,指令微調大大提高了所有模型類型的歸一化平均性能,與非微調模型相比,T5 模型從指令微調中受益最多。這些結果對于某些基準測試來說是相當強的——例如,Flan-T5-XL 只有 30 億參數,就達到了 47.6% 的 MMLU 分數,超過了 GPT-3 1750 億參數的 43.9% 分數。

除了 NLP 基準之外,語言模型還能夠為開放式問題請求生成長格式答案。在這一方面,標準的 NLP 基準和用于評估它們的自動指標不足以衡量人類的偏好。研究人員對此進行了評估,創建了一個包含 190 個示例的評估集。該評估集包括以零樣本方式向模型提出的問題,涉及五個具有挑戰性的類別,每個類別 20 個問題:創造力、上下文推理、復雜推理、計劃和解釋。

對于其中的 60 個示例(來自復雜的推理、計劃和解釋類別),該研究創建了一個帶有思維鏈觸發短語(例如,「讓我們一步一步思考」)的變體,作為微調是否進行的另一個評估在 CoT 上啟用 zero-shot。除了上述 160 個零樣本輸入之外,研究中還包括 30 個用于測試少樣本能力的輸入,這些沒有指令微調的強語言模型已被證明在這些方面表現良好。

研究人員認為,指令微調和規模擴展均可以持續提升大語言模型性能,而微調對于推理能力至關重要,其還能泛化模型能力。通過指令微調與其他模型適應技術(例如 UL2R)結合,谷歌在這項工作中提出了最強模型 Flan-U-PaLM。

重要的是,指令微調并不像模型規模擴展一樣會大幅增加計算成本,例如對于 PaLM 540B,指令微調只需要 0.2% 的預訓練計算,但卻可以將跨評估基準的歸一化平均值提高 9.4%。使用指令微調的小型模型有時可以勝過沒有微調的大模型。

出于這些原因,研究人員建議對幾乎所有預訓練的語言模型都進行指令微調。

原文地址:http://www.myzaker.com/article/63541a748e9f090dee776cae

版權聲明:虛像 發表于 2022年10月24日 am8:36。
轉載請注明:30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了 | 快導航網

相關文章

菠萝菠萝蜜在线观看| 天堂在线观看一卡二卡三卡四卡| 亚洲色图视频免费播放| 性欧美videos| 天堂蜜桃91精品| 手机av在线网| 九九久久精品| 91免费网站视频| 成人免费一区| 国产精品乱子乱xxxx| 拍真实国产伦偷精品| 欧美极品少妇xxxxⅹ裸体艺术 | 国产精品视频一二三| aaaaa级少妇高潮大片免费看| 欧美成熟视频| 无码日韩人妻精品久久蜜桃| 日本亚洲不卡| 99热这里只有精品7| 黄瓜视频成人app免费| 99久久无色码| 最新黄网在线观看| 日本高清视频精品| 日本v片在线免费观看| 久久天天躁狠狠躁夜夜躁2014| h在线免费观看| 亚洲国产日韩精品在线| 国产黄色免费| 91麻豆精品国产无毒不卡在线观看| 97av视频在线观看| 羞羞视频免费| 欧美猛男男办公室激情| 亚洲欧美日本在线观看| 精品女厕一区二区三区| av手机免费看| 一卡二卡三卡日韩欧美| 亚洲系列在线观看| 成人免费在线播放视频| 波多野结衣视频在线看| 国产欧美一区二区三区沐欲| 日韩精品人妻中文字幕| av亚洲精华国产精华精| 国产极品国产极品| 国产成人亚洲综合a∨婷婷| 男女男精品视频网站| 久久99国产精品久久| 国产女主播喷水高潮网红在线| 久久福利一区| 国产福利在线观看视频| 久久精品天堂| 精品中文字幕在线播放| 日韩影院精彩在线| av网站免费在线播放| 日本一不卡视频| 中国毛片在线观看| 美腿丝袜在线亚洲一区| 国产免费一区二区三区网站免费| 日韩精品亚洲一区二区三区免费| 亚洲av片不卡无码久久| 免费人成在线不卡| 亚洲激情图片网| 国产精品香蕉一区二区三区| 亚洲女同二女同志奶水| 国产sm精品调教视频网站| 九九热国产精品视频| 99精品国产91久久久久久| 97超碰人人干| 国产欧美精品一区二区三区四区| 国产精品久免费的黄网站| 中文字幕一区二区三区在线观看| 一级α片免费看刺激高潮视频| 亚洲伦理在线精品| 丰满大乳国产精品| 欧美日韩专区在线| 超碰在线91| 亚洲免费精彩视频| 国产二级片在线| 欧美激情videos| 国产对白叫床清晰在线播放| 国产精品亚洲视频在线观看| 国产手机在线视频| 136国产福利精品导航网址| 一区二区三区四区影院| 视频在线观看国产精品| 国产欧美一区二区三区在线观看视频| 国产麻豆精品视频| 久久99久久98精品免观看软件 | 日韩成人中文字幕| 成人淫片免费视频95视频| 在线亚洲欧美视频| 最新亚洲伊人网| 日韩免费观看网站| 欧美videossex另类| 精品不卡在线| 欧美激情三级| av之家在线观看| 一区二区在线| 强伦人妻一区二区三区| 国产一区二区女| 在哪里可以看毛片| 成人h动漫精品| 日韩黄色片网站| 黄网站色欧美视频| 成年女人免费毛片视频永久| 精品卡一卡二卡三卡四在线| 四虎影视永久免费观看| 欧美激情伊人电影| 日本乱理伦在线| 鲁丝一区二区三区免费| 大型av综合网站| jizz欧美激情18| 久久国产精品99国产| 自拍偷拍第9页| 国产午夜精品久久久久久免费视 | 懂色aⅴ精品一区二区三区| 一区二区在线不卡| 国产一区二区电影在线观看| 久久精品久久99| 蜜桃av噜噜一区| 日韩av在线播| 亚洲午夜免费福利视频| 欧美一级手机免费观看片| 亚洲欧美在线免费| 在线看小视频| 92裸体在线视频网站| 免费一级欧美在线观看视频| 成人免费观看cn| 亚洲大片在线| 很污很黄的网站| 国产精品美日韩| 亚洲欧美色视频| 亚洲美女自拍视频| 1024亚洲| 成年无码av片在线| 在线观看免费高清完整| 久久大片网站| 国产九一精品| 亚洲av成人精品一区二区三区| 成人午夜电影久久影院| 91亚洲国产成人久久精品麻豆| 欧美猛男超大videosgay| 偷窥自拍亚洲色图| 538国产精品一区二区免费视频| 永久免费毛片在线播放| 日韩av一区二区三区美女毛片| 欧美美女在线| 中文乱码人妻一区二区三区视频| 成人深夜视频在线观看| av中文字幕观看| 精品电影一区二区| 亚洲美女电影在线| 风间由美一区二区三区| 色婷婷av一区二区三区丝袜美腿 | 精品国产精品国产偷麻豆| 国产精品视频中文字幕| 狠狠色狠狠色综合| 国产免费高清视频| 亚洲成人黄色在线| 久久久久久久影视| 欧美一区亚洲二区| 美女午夜精品| 黑丝av在线播放| 国产精品三级av在线播放| 天堂在线www天堂中文在线| 少妇激情综合网| 四虎影院观看视频在线观看| 日韩精品一区二区三区电影| www.操操| 在线免费精品视频| 免费网站观看电影入口| 2019av中文字幕| 成人免费av电影| av免费网站观看| 国产麻豆91精品| a级片在线免费看| 在线免费观看一区| 激情丁香在线| 97免费高清电视剧观看| 网曝91综合精品门事件在线| 黄色工厂在线观看| 国产精品久久久久7777按摩| 国产一二三四| 欧美一区二粉嫩精品国产一线天| 免费在线国产视频| 欧美三级一级片| 精品一区二区三区免费观看| 精品人妻少妇AV无码专区| 亚洲情综合五月天| 少妇av在线| 男人添女人下面高潮视频| 精东粉嫩av免费一区二区三区| 中文字幕乱码视频| 亚洲国产欧美在线成人app| 看黄网站在线观看| 91精品国产91久久久久麻豆 主演| 日韩av一级电影| 国产高潮流白浆喷水视频| 亚洲午夜性刺激影院| 97人人在线视频| 国产又黄又猛又粗| 国产午夜亚洲精品理论片色戒|