當人工智能的浪潮席卷全球,北京正以科技創新之姿,成為AI大模型領域的戰略高地。從智源研究院的“悟道”大模型問世,到“天使投資人”模式孵化頂尖學者,再到月之暗面、DeepSeek、智譜等人工智能獨角獸崛起,這座城市不僅匯聚了前沿技術,更以開放生態孕育突破性成果。
如今,北京正積極打造“全球開源之都”,一大批研發機構、企業積極擁抱開源,而開源也已深入到汽車、機器人等眾多行業。發展AI將是一場科技長征,新京報AI研究院將深度訪談此次AI浪潮的親歷者與見證人,講述AI競爭新格局與背后的故事。
劉知遠向記者講解AI技術發展歷程。 新京報貝殼財經記者 羅亦丹 攝
邁入2025年,中國AI(人工智能)站上足以與美國分庭抗禮的戰略制高點。這一年,劉知遠已經在AI追趕的路上走了近20年。
作為清華大學副教授、面壁智能聯合創始人兼首席科學家,五年前,他訓練了中文預訓練模型的第一個版本,而由他參與、智源研究院發布的“悟道2.0”也成為中國第一個萬億大模型。
彼時,一個爭論的焦點就是大模型研發應該“從大煉模型,到煉大模型”。2023年,ChatGPT破圈宣布了“煉大模型”路線的正確。
如今,面對DeepSeek走紅,劉知遠表示,“2024年時,還有很多投資人問我‘你覺得中國AI跟美國比是越來越近,還是越來越遠’,我的回答始終是越來越近”。DeepSeek的出現是一個非常強有力的信號,讓人看到世界舞臺上,中國的人工智能技術已經具有一席之地。
劉知遠親歷了符號主義黃昏下的困惑、見證了深度學習浪潮掀翻傳統范式,更是中國AI大模型創業浪潮中的深度參與者之一。2023年至今,國內多個AI“小龍”“小虎”涌現,大模型百花齊放。在劉知遠看來,DeepSeek成功的前提是具備了匹配資金和技術的“天才土壤”,這也是其帶給業內的最大啟示。
在接受新京報AI研究院專訪時,劉知遠篤定,AI創業者的終極目標是奔向AGI(通用人工智能),但過程絕非坦途,并提醒市場需要更多耐心:一個投資人投了“六小虎”但沒有投DeepSeek,不見得就是投錯了,難道中國不允許出現10個以上的DeepSeek?為什么不能等一等這些潛在的DeepSeek成長?
啟蒙·越來越近的追趕
新京報AI研究院:你從什么時候開始研究AI?AI大語言模型技術何時給你“第一次震撼”?
劉知遠:我2006年讀研究生時開始從事自然語言處理研究,那時自然語言處理還處在統計學習的時代,深度學習的時代尚未到來。
2011年至2012年,我的老師孫茂松教授申請了科技部的973計劃項目,這項基礎研究課題項目的資金額達到數千萬元,是國內最早在自然語言處理方向上獲得大規模支持的專項之一,如果說哪一個時間點對中國AI大模型的發展具有深遠影響,這件事就是其中之一。
孫老師認為,既然要做5年的項目,就要找比較前沿性、前瞻性的方向。為了確定這筆資金的具體使用方法,他組織了北大、哈工大、中科大自動化所、百度在內的幾個單位以及全國自然語言處理領域半數頂尖學者進行討論,最終定下了一個方向:深度學習。
這一項目申請成功之后,2013年,國外發布了word2vec方法。簡單來講,word2vec首先發現了詞可以用向量表示,這是深度學習在自然語言處理領域應用上里程碑式的成功,也是深度學習對我的“第一次震撼”。于是我們立即開始跟進。當時,我們與國外領先水平大概有三四年的差距。
實際上,國內學界開始大規模認可深度學習,達成共識是2015年,比2013已經晚了兩三年,但大體上,我們一直處于不斷追趕,身位越來越近的追趕過程。
新京報AI研究院:公眾知曉大語言模型主要是在ChatGPT出現之后,對于學界來說,有哪些“ChatGPT時刻”?為了追趕新技術,你們做了什么?