摘要Life Prompt這次將東京大學與京都大學二次試驗題目轉為圖像資料,再輸入ChatGPT作答;申論題部分則交由補教機構河合塾講師評分,並與大學入學共通測驗成績合併計算總分。
生成式人工智慧在升學考試中的表現再度受到關注。 日本東京AI新創公司Life Prompt以OpenAI開發的「ChatGPT-5.2 Thinking」模型挑戰東京大學與京都大學今年入學考試題目,結果多項成績超越實際錄取考生最高分,被指已達「首席合格」水準。
東大測驗展現綜合解題力
Life Prompt這次將東京大學與京都大學二次試驗題目轉為圖像資料,再輸入ChatGPT作答;申論題部分則交由補教機構河合塾講師評分,並與大學入學共通測驗成績合併計算總分。 由於題目包含圖表、計算與論述形式,測試結果也被視為觀察大型語言模型綜合解題能力的重要案例。

在東京大學部分,滿分550分的考試中,ChatGPT於文科1至3類取得452分,理科1至3類取得503分。 這兩項成績均高於校方公布的最高錄取分,其中文科3類最高為434分,理科3類最高為453分;競爭激烈的理科3類,AI分數更比真人榜首高出50分。
京大成績凸顯強弱科差異
從科目表現來看,ChatGPT在今年難度高的數學科拿下滿分,英語得分率也達9成。 相較之下,世界史等需要長篇論述、脈絡理解與文章結構安排的科目仍明顯較弱,60分僅取得15分,顯示模型雖具備大量知識與計算能力,但在史觀表達與論述完整性上仍有不足。
Life Prompt過去也曾以OpenAI模型挑戰日本頂尖大學考題。 2024年,當時模型參加東京大學入學考試仍未達錄取門檻;去年同一時期解答東大理科數學題時,120分中僅得38分,如今已能取得滿分,短短兩年間的進展凸顯生成式AI能力快速提升,也將持續引發教育現場對考試設計與AI應用界線的討論。
※ 圖片為示意畫面,僅用於新聞報導與合理使用

