{ SKIP }
文:MenClub 魏文青  
POSTED ON 30 Oct 2025

以前大家「有事問Google」,依家大家就可能已經習慣「有事問AI」,甚至有人會於網上討論時貼出AI答案當係金科玉律,認為AI講嘅嘢就一定啱。但《BBC》及歐洲廣播聯盟 (EBU) 近來公佈嘅一個最新研究,就發現市面上所有AI於處理新聞議題時有近50%機會出錯,當中包括錯誤引用、內容準確性等問題。而眾多AI中又以Google Gemini為最差。換言之,距離大家能夠靠AI提供一切答案嘅日子仍然離我哋好遠。

圖片:ImageFX

《BBC》及EBU早前進行咗一個大型研究,搵黎多名專業新聞記者去審查ChatGPT、Copilot、Gemini及Perplexity有關新聞嘅回覆,並評定AI回覆是否準確、是否有引用正確來源、能否分辦事實與意見、以及為閱讀者提供語境等。

結果就發現,有45%嘅AI回覆均有至少一項錯誤。當中31%回覆有嚴重引用錯誤,例如誤導、錯誤,又或直接缺失新聞來源引用;20%回覆則提供錯誤資訊,當中包括過期消息,以及「AI幻覺」資訊(即係AI自己作出黎嘅)等。亦即係話,如果用家無自己去做Fact Check的話,有近半機率會被AI誤導。

圖片:ImageFX

有趣嘅係,報告特別點名Google Gemini表現差劣,指其76%回覆都有錯誤,比其他高出一倍有多,而當中最主要嘅係錯誤引用問題。要留意嘅係Google依家會用Gemini為普通搜尋整理出總結,換言之佢好可能係普通人最常接觸到嘅AI。其影響亦可能係最為廣泛。

成份報告唯一正面嘅,係各大AI嘅表現其實已經比起今年2月嘅同系列研究有所改進,只係仍然唔合格咁解。《BBC》生成式AI專案總裁Peter Archer亦強調,作為新聞業者佢哋係希望AI工具能夠成功,以令更多人接觸到準確嘅新聞內容,不過目前睇黎都仲有好長條路要行。

資料來源:BBC

相信大家都試過,一大班朋友出嚟聚會,影完相或片想互相分享時,結果因為有人用iPhone、有人用Android,所以無單靠AirDrop或Quick Share一次過搞掂,最後唯有將啲相同片掉上WhatsApp群組,大家只能收到經壓縮嘅檔案 ...
tech
【科技】Android手機終於可以同iPhone互傳檔案!Google宣布Quick Share現已兼容AirDrop
21 Nov 2025
微軟旗下作業系統Windows歷史悠久,相信大家都用過好幾個版本。隨住Windows 11逐漸成為市場主流,最近外媒《Digital Trends》就回顧咗過往12個Windows 版本,並作出排名。唔知大家又覺得最好同最差係邊代呢? ...
tech
【科技】外媒評選歷代Windows版本 Windows 7奪冠、Windows Me最差
20 Nov 2025