サイトアイコン ガジェット2ch

中国AI「DeepSeek」正確な答えを出せない確率83%wwwwwwwww

どんな質問で?

1: 名無しさん@涙目です。(愛媛県) [ニダ] 2025/01/30(木) 11:34:58.61 ID:tIPGaYyF0● BE:135853815-PLT(13000)
中国AI「ディープシーク」検証レポート“正確な答え出せない確率83%”

ウェブサイトの信頼性を評価する「ニュースガード」が29日に公表したレポートによりますと、ディープシークのAIアプリを検証したところニュースや情報などについての質問に対し虚偽の主張となる確率は30%、無回答となる確率が53%と正しい答えを出せない確率は83%に上ったということです。

https://news.yahoo.co.jp/articles/9ba2d774d7d7cf5d71840ab7dd8bfdc3bfacdaad

2: 名無しさん@涙目です。(庭) [CN] 2025/01/30(木) 11:35:51.12 ID:JbOVn/SJ0
習近平はイケメンですか?

85: 名無しさん@涙目です。(光) [US] 2025/01/30(木) 12:15:25.61 ID:JwCEVAdy0
>>2
習近平はプーさんです

107: 名無しさん@涙目です。(ジパング) [ニダ] 2025/01/30(木) 12:39:16.39 ID:2PiWbiMy0
>>85
はい行方不明

7: 名無しさん@涙目です。(東京都) [ニダ] 2025/01/30(木) 11:37:26.86 ID:TsgXuSgs0
アクセスするのも怖いな

11: 名無しさん@涙目です。(福井県) [AU] 2025/01/30(木) 11:38:41.43 ID:E6de6NQU0
いやLLMの性能を評価するって実際簡単じゃないと思うんだけど、
どうなんだろね
deep seekがopen AI上回った!って言い張ってるのはベンチマークの数字でしかないってのは当たり前な上で

12: 名無しさん@涙目です。(みょ) [GB] 2025/01/30(木) 11:39:05.46 ID:AgG1pa1+0
たとえどんなに高性能でも中国政府の立場からしか話ができないならポンコツAIだろ

18: 名無しさん@涙目です。(庭) [US] 2025/01/30(木) 11:41:12.86 ID:BlqrMkmK0
いや問題はそこじゃなくてオープンライセンスってとこじゃないの?
コモディティ化を促進する戦略だよな

中国は米国の巨大企業のAI覇権を自分の力だけでなく、西側の新興企業と自由経済の力で崩そうとしてるって事だろ

21: 名無しさん@涙目です。(日本のどこか) [US] 2025/01/30(木) 11:42:09.08 ID:NqmDTMyD0
まあ今あるAIも平気な顔して嘘つくしお互い様アル

20: 名無しさん@涙目です。(ジパング) [US] 2025/01/30(木) 11:42:08.09 ID:qGVAXKi/0
しゃべっていいかどうか考えるのにリソース取られてるんだろう

24: 名無しさん@涙目です。(福井県) [AU] 2025/01/30(木) 11:43:40.13 ID:E6de6NQU0
ニュースのネタで評価するってさ、
中国AIが中国政府関連の事をまともに答えられないのをわかった上で
低い性能出すためにその評価方法にしたなんてことないよね?

34: 名無しさん@涙目です。(会社) [CN] 2025/01/30(木) 11:47:40.21 ID:MPzk7R3d0
>>24
それに答えられないのは立派な問題だと思うが

117: 名無しさん@涙目です。(やわらか銀行) [US] 2025/01/30(木) 12:47:12.30 ID:gUfsEE4N0
>>34
他所のAIも米大統領選の質問には答えませんとかしてるよ?

29: 名無しさん@涙目です。(茸) [NL] 2025/01/30(木) 11:45:57.19 ID:RilmBGvt0
で、日本のAIは?

31: 名無しさん@涙目です。(鹿児島県) [GB] 2025/01/30(木) 11:46:14.47 ID:3GeVJiFF0
w

38: 名無しさん@涙目です。(ジパング) [US] 2025/01/30(木) 11:48:42.51 ID:+/2YKqtv0
突然、中国のAIが安価で凄いとか騒ぎ始めて変だと思ってたら
このザマw

46: 名無しさん@涙目です。(みょ) [ニダ] 2025/01/30(木) 11:50:44.56 ID:N3906tUW0
難関大学の試験問題を正解するってのどこいったw

50: 名無しさん@涙目です。(茸) [BR] 2025/01/30(木) 11:51:58.00 ID:u95iMdiw0
プーさんについて教えて

63: 名無しさん@涙目です。(福岡県) [US] 2025/01/30(木) 12:02:47.91 ID:2HFep4W50
なんか中国のAI凄いとかEV凄いみたいな持ち上げ続いてたけど結局マネーゲームネタか

71: 名無しさん@涙目です。(東京都) [JP] 2025/01/30(木) 12:07:17.76 ID:1xePwXau0
GoogleAIが割と良い感じではないかと思う
俺達がググるのと大差ないというか
たまに間違ってるけど

79: 名無しさん@涙目です。(茸) [US] 2025/01/30(木) 12:13:04.13 ID:TCqyJZXt0
ディープシーク「正確な答えはオープンAIに聞け」

82: 名無しさん@涙目です。(庭) [ニダ] 2025/01/30(木) 12:13:59.10 ID:9Lh4EsEs0
ふつうに使えるけどな

83: 名無しさん@涙目です。(みかか) [US] 2025/01/30(木) 12:14:09.86 ID:fSzdJXub0
ニュースとか検索につかってるやつアホだよななにも使いこなせない

90: 名無しさん@涙目です。(庭) [EU] 2025/01/30(木) 12:17:33.43 ID:ghsYkEE20
やっぱ見た目上のスピードを速くするために手順をどっか省略してるんだな

で、答えがそれでも合う奴だけピックアップして速度比較w

95: 警備員[Lv.12][新](庭) [ニダ] 2025/01/30(木) 12:23:02.20 ID:+n04pmks0
一般人レベルより少しマシなくらいか

102: 名無しさん@涙目です。(庭) [CA] 2025/01/30(木) 12:32:34.50 ID:/Hp0U1WG0
AIの答えの信憑性は、まんま情報ソースの信憑性だからな
金盾の裏側だけでラーニングしてたらそうなるわな

103: 名無しさん@涙目です。(ジパング) [UA] 2025/01/30(木) 12:32:46.73 ID:K5yIgEiP0
チャイナクオリティ

112: 名無しさん@涙目です。(茸) [ニダ] 2025/01/30(木) 12:41:58.43 ID:HgJq/bU80
家で眠ってるスマホをコンビニのWiFiに繋いで試してみるか

118: 名無しさん@涙目です。(庭) [ニダ] 2025/01/30(木) 12:47:52.77 ID:ay6+Hkc+0
まあ、安定の中華製だからなwww

108: 名無しさん@涙目です。(茸) [US] 2025/01/30(木) 12:39:40.82 ID:bKQ3Xss90
AI界の先行者か
俺にはもう中国仕草だと笑えないよ

129: 名無しさん@涙目です。(愛知県) [JP] 2025/01/30(木) 12:56:36.86 ID:ZhkdUBUR0
ほぼデタラメってか
いかにも中華製品らしいなw

133: 名無しさん@涙目です。(茸) [US] 2025/01/30(木) 13:00:02.80 ID:2F0Kw2EI0
急に正解率に関しての叩き記事が多くなってきた違和感w なんなんこれ

136: 名無しさん@涙目です。(庭) [US] 2025/01/30(木) 13:03:41.70 ID:YblnJWxX0
あまりの酷さに擁護勢が退散してるだけだぞ

137: 警備員[Lv.21](庭) [DE] 2025/01/30(木) 13:07:34.66 ID:Z+MDaQN20
立場で答えが変わるのはある意味人間に近付いた証拠だな

146: 名無しさん@涙目です。(やわらか銀行) [CN] 2025/01/30(木) 13:34:40.04 ID:3PmtBu+60
中国にはお似合いのAIだったね

144: 名無しさん@涙目です。(ジパング) [CL] 2025/01/30(木) 13:23:44.24 ID:yRQdHJP60
なんでNVIDIAの株価落ちたんだよ!

引用元:・https://hayabusa9.5ch.net/test/read.cgi/news/1738204498/

モバイルバージョンを終了