能战胜行测图形推理题目吗?阿里推出QVQ
作者:熱點(diǎn) 來(lái)源:探索 瀏覽: 【大 中 小】 發(fā)布時(shí)間:2025-08-02 09:17:10 評(píng)論數(shù):
今日凌晨,阿里旗下的通義千問(wèn)推出了一款視覺(jué)推理模型——QVQ-Max,Qwen團(tuán)隊(duì)稱該模型具備理解圖片與視頻內(nèi)容的能力,并且還能根據(jù)所提供的信息展開(kāi)分析推理。
我們目前所用到的常見(jiàn)大模型雖然也能上傳圖片,但是只能識(shí)別圖片里的文字,對(duì)畫面圖形則缺少概念,因此不能算作視覺(jué)推理模型,QVQ-Max則著重提升了這一點(diǎn)。
“例如,在一道幾何題中,它可以根據(jù)題目附帶的圖形推導(dǎo)出答案;在一段視頻里,它能根據(jù)畫面內(nèi)容推測(cè)出接下來(lái)可能發(fā)生的情節(jié)。”
不過(guò)光看千問(wèn)團(tuán)隊(duì)的宣傳好像也感覺(jué)不出來(lái)到底有多厲害,不如咱們直接來(lái)給它上上強(qiáng)度。
熱點(diǎn)科技這里準(zhǔn)備了幾道公務(wù)員行測(cè)的圖形推理模擬題,來(lái)看看QVQ-Max到底能不能給出正確答案。
首先我們?cè)赒WEN CHAT平臺(tái)選擇這一模型,將從網(wǎng)上收集到的題目圖片上傳,直接詢問(wèn)答案。不過(guò)需要注意的是,或許是由于該模型今天才上線,在上傳題目圖片時(shí)總是提示網(wǎng)絡(luò)錯(cuò)誤,稍后再試。大家可能需要耐心點(diǎn)多試幾次。
第一題如圖,QVQ-Max響應(yīng)很快,但是想的好像有點(diǎn)多,思考了足足3500個(gè)漢字才給出答案D選項(xiàng),但是回答錯(cuò)誤,正確答案是B。
一題好像并不能證明實(shí)力,咱們又上傳了新的一題,看看QVQ-Max能不能一雪前恥。不過(guò)這一題對(duì)于QVQ-Max來(lái)說(shuō)好像有點(diǎn)困難,竟然思考了多達(dá)6000個(gè)漢字才給出答案,仍然是D選項(xiàng),仍然是錯(cuò)誤的,正確答案是B。
最后一次,再來(lái)一題。好在這次結(jié)果還算好,QVQ-Max給出了正確的答案B選項(xiàng),但是思考時(shí)間實(shí)在太長(zhǎng),依然足足有6000個(gè)漢字,等待時(shí)間接近十分鐘,如果QVQ-Max去考試,恐怕沒(méi)做完題目就要收卷了。
看起來(lái)行測(cè)的圖形推理題目對(duì)于QVQ-Max來(lái)說(shuō)有點(diǎn)超綱,本想試著上傳一段視頻,測(cè)測(cè)QVQ-Max的視頻能力,但是顯示一直上傳失敗,只得作罷。有興趣的朋友可以自行去測(cè)試一下QVQ-Max的其他能力噢。
根據(jù)Qwen團(tuán)隊(duì)的解釋,QVQ-Max目前只是第一版,還有很多提升空間。希望Qwen團(tuán)隊(duì)加把勁,讓QVQ-Max早日拿捏行測(cè)圖形推理。