中国AI「DeepSeek」正確な答えを出せない確率83%ｗｗｗｗｗｗｗｗｗ

サービス

2025.01.30

どんな質問で？

1: 名無しさん＠涙目です。(愛媛県) [ﾆﾀﾞ] 2025/01/30(木) 11:34:58.61 ID:tIPGaYyF0● BE:135853815-PLT(13000)

中国AI「ディープシーク」検証レポート“正確な答え出せない確率83％”

ウェブサイトの信頼性を評価する「ニュースガード」が29日に公表したレポートによりますと、ディープシークのAIアプリを検証したところニュースや情報などについての質問に対し虚偽の主張となる確率は30％、無回答となる確率が53％と正しい答えを出せない確率は83％に上ったということです。

Yahoo!ニュース

Yahoo!ニュースは、新聞・通信社が配信するニュースのほか、映像、雑誌や個人の書き手が執筆する記事など多種多様なニュースを掲載しています。

2: 名無しさん＠涙目です。(庭) [CN] 2025/01/30(木) 11:35:51.12 ID:JbOVn/SJ0

習近平はイケメンですか？

85: 名無しさん＠涙目です。(光) [US] 2025/01/30(木) 12:15:25.61 ID:JwCEVAdy0

>>2
習近平はプーさんです

107: 名無しさん＠涙目です。(ジパング) [ﾆﾀﾞ] 2025/01/30(木) 12:39:16.39 ID:2PiWbiMy0

>>85
はい行方不明

7: 名無しさん＠涙目です。(東京都) [ﾆﾀﾞ] 2025/01/30(木) 11:37:26.86 ID:TsgXuSgs0

アクセスするのも怖いな

11: 名無しさん＠涙目です。(福井県) [AU] 2025/01/30(木) 11:38:41.43 ID:E6de6NQU0

いやLLMの性能を評価するって実際簡単じゃないと思うんだけど、
どうなんだろね
deep seekがopen AI上回った！って言い張ってるのはベンチマークの数字でしかないってのは当たり前な上で

12: 名無しさん＠涙目です。(みょ) [GB] 2025/01/30(木) 11:39:05.46 ID:AgG1pa1+0

たとえどんなに高性能でも中国政府の立場からしか話ができないならポンコツAIだろ

18: 名無しさん＠涙目です。(庭) [US] 2025/01/30(木) 11:41:12.86 ID:BlqrMkmK0

いや問題はそこじゃなくてオープンライセンスってとこじゃないの？
コモディティ化を促進する戦略だよな

中国は米国の巨大企業のAI覇権を自分の力だけでなく、西側の新興企業と自由経済の力で崩そうとしてるって事だろ

21: 名無しさん＠涙目です。(日本のどこか) [US] 2025/01/30(木) 11:42:09.08 ID:NqmDTMyD0

まあ今あるAIも平気な顔して嘘つくしお互い様アル

20: 名無しさん＠涙目です。(ジパング) [US] 2025/01/30(木) 11:42:08.09 ID:qGVAXKi/0

しゃべっていいかどうか考えるのにリソース取られてるんだろう

24: 名無しさん＠涙目です。(福井県) [AU] 2025/01/30(木) 11:43:40.13 ID:E6de6NQU0

ニュースのネタで評価するってさ、
中国AＩが中国政府関連の事をまともに答えられないのをわかった上で
低い性能出すためにその評価方法にしたなんてことないよね？

34: 名無しさん＠涙目です。(会社) [CN] 2025/01/30(木) 11:47:40.21 ID:MPzk7R3d0

>>24
それに答えられないのは立派な問題だと思うが

117: 名無しさん＠涙目です。(やわらか銀行) [US] 2025/01/30(木) 12:47:12.30 ID:gUfsEE4N0

>>34
他所のAIも米大統領選の質問には答えませんとかしてるよ？

29: 名無しさん＠涙目です。(茸) [NL] 2025/01/30(木) 11:45:57.19 ID:RilmBGvt0

で、日本のAIは？

31: 名無しさん＠涙目です。(鹿児島県) [GB] 2025/01/30(木) 11:46:14.47 ID:3GeVJiFF0

w

38: 名無しさん＠涙目です。(ジパング) [US] 2025/01/30(木) 11:48:42.51 ID:+/2YKqtv0

突然、中国のAIが安価で凄いとか騒ぎ始めて変だと思ってたら
このザマｗ

46: 名無しさん＠涙目です。(みょ) [ﾆﾀﾞ] 2025/01/30(木) 11:50:44.56 ID:N3906tUW0

難関大学の試験問題を正解するってのどこいったｗ

50: 名無しさん＠涙目です。(茸) [BR] 2025/01/30(木) 11:51:58.00 ID:u95iMdiw0

プーさんについて教えて

63: 名無しさん＠涙目です。(福岡県) [US] 2025/01/30(木) 12:02:47.91 ID:2HFep4W50

なんか中国のAI凄いとかEV凄いみたいな持ち上げ続いてたけど結局マネーゲームネタか

71: 名無しさん＠涙目です。(東京都) [JP] 2025/01/30(木) 12:07:17.76 ID:1xePwXau0

GoogleAIが割と良い感じではないかと思う
俺達がググるのと大差ないというか
たまに間違ってるけど

79: 名無しさん＠涙目です。(茸) [US] 2025/01/30(木) 12:13:04.13 ID:TCqyJZXt0

ディープシーク「正確な答えはオープンAIに聞け」

82: 名無しさん＠涙目です。(庭) [ﾆﾀﾞ] 2025/01/30(木) 12:13:59.10 ID:9Lh4EsEs0

ふつうに使えるけどな

83: 名無しさん＠涙目です。(みかか) [US] 2025/01/30(木) 12:14:09.86 ID:fSzdJXub0

ニュースとか検索につかってるやつアホだよななにも使いこなせない

90: 名無しさん＠涙目です。(庭) [EU] 2025/01/30(木) 12:17:33.43 ID:ghsYkEE20

やっぱ見た目上のスピードを速くするために手順をどっか省略してるんだな

で、答えがそれでも合う奴だけピックアップして速度比較w

95: 警備員[Lv.12][新](庭) [ﾆﾀﾞ] 2025/01/30(木) 12:23:02.20 ID:+n04pmks0

一般人レベルより少しマシなくらいか

102: 名無しさん＠涙目です。(庭) [CA] 2025/01/30(木) 12:32:34.50 ID:/Hp0U1WG0

AIの答えの信憑性は、まんま情報ソースの信憑性だからな
金盾の裏側だけでラーニングしてたらそうなるわな

103: 名無しさん＠涙目です。(ジパング) [UA] 2025/01/30(木) 12:32:46.73 ID:K5yIgEiP0

チャイナクオリティ

112: 名無しさん＠涙目です。(茸) [ﾆﾀﾞ] 2025/01/30(木) 12:41:58.43 ID:HgJq/bU80

家で眠ってるスマホをコンビニのWiFiに繋いで試してみるか

118: 名無しさん＠涙目です。(庭) [ﾆﾀﾞ] 2025/01/30(木) 12:47:52.77 ID:ay6+Hkc+0

まあ、安定の中華製だからなwww

108: 名無しさん＠涙目です。(茸) [US] 2025/01/30(木) 12:39:40.82 ID:bKQ3Xss90

AI界の先行者か
俺にはもう中国仕草だと笑えないよ

129: 名無しさん＠涙目です。(愛知県) [JP] 2025/01/30(木) 12:56:36.86 ID:ZhkdUBUR0

ほぼデタラメってか
いかにも中華製品らしいなｗ

133: 名無しさん＠涙目です。(茸) [US] 2025/01/30(木) 13:00:02.80 ID:2F0Kw2EI0

急に正解率に関しての叩き記事が多くなってきた違和感ｗ　なんなんこれ

136: 名無しさん＠涙目です。(庭) [US] 2025/01/30(木) 13:03:41.70 ID:YblnJWxX0

あまりの酷さに擁護勢が退散してるだけだぞ

137: 警備員[Lv.21](庭) [DE] 2025/01/30(木) 13:07:34.66 ID:Z+MDaQN20

立場で答えが変わるのはある意味人間に近付いた証拠だな

146: 名無しさん＠涙目です。(やわらか銀行) [CN] 2025/01/30(木) 13:34:40.04 ID:3PmtBu+60

中国にはお似合いのAIだったね

144: 名無しさん＠涙目です。(ジパング) [CL] 2025/01/30(木) 13:23:44.24 ID:yRQdHJP60

なんでNVIDIAの株価落ちたんだよ！

引用元:・https://hayabusa9.5ch.net/test/read.cgi/news/1738204498/

コメント

名前:機種名NA-07C : 投稿日：2025/01/30(木) 14:55:57 ID:Ta/ksKz4 ID：Q5NTE5MzY

> なんでNVIDIAの株価落ちたんだよ！
投資家が儲けるために情報利用したからだよ
名前:機種名NA-07C : 投稿日：2025/01/30(木) 15:12:25 ID:0EFLmsBq ID：k4MTYyMjE

株価なんて水物
去年の最初にもう終わりだと言われてた銘柄だしな
名前:機種名NA-07C : 投稿日：2025/01/30(木) 16:06:43 ID:5bMztJ/5 ID：AwNDk1MjQ

爆発する心配がないだけまし
名前:機種名NA-07C : 投稿日：2025/01/30(木) 16:15:04 ID:yBd2UpBa ID：I3Njc0Mzk

事実を確認する問題が苦手なのはそのとおりだが推論は強いのでプログラミングではGhatGPTより劣ってるものの僅差で、数学ではGhatGPTより正答率が高い
得意不得意が違うだけで総合的な性能は互角だよ
苦手なところをクローズアップしてネガキャンしてるだけ
名前:機種名NA-07C : 投稿日：2025/01/30(木) 16:28:57 ID:80CPK8nV ID：cyMjgzNTQ

パープレでR1とo1を交互に使ってみたが、R1はちょっとハルシネーションが酷い気がした
基本有能なのにとんでもない嘘を混じって回答出すからちょっと怖い
推論が得意でも前提を間違えてたらそりゃああかんわ
名前:機種名NA-07C : 投稿日：2025/01/30(木) 16:31:36 ID:50traAYU ID：EwMTczNTM

天安門事件も答えられないＡＩじゃゴミでしょ
名前:機種名NA-07C : 投稿日：2025/01/30(木) 16:38:53 ID:80CPK8nV ID：cyMjgzNTQ

※6
オープンソース版は多分答えられるでしょ
尖閣諸島は日本領だと答えるし、過去に中国側が日本領であると認知していたことにも触れてた
名前:機種名NA-07C : 投稿日：2025/01/30(木) 16:53:34 ID:50traAYU ID：EwMTczNTM

>>7
検証済み
一生懸命学習させてるやつ居るけど結果は知らないｗ
名前:機種名NA-07C : 投稿日：2025/01/30(木) 16:54:33 ID:MG3HJFx9 ID：c4OTgwNTE

まあ先行者だよね。最初バカにしてたのに数年後にはもう誰もバカにできない水準に達してる
名前:機種名NA-07C : 投稿日：2025/01/30(木) 16:57:29 ID:50traAYU ID：EwMTczNTM

>>9
中国共産党を批判できるＡＩ作れるならね
名前:機種名NA-07C : 投稿日：2025/01/30(木) 17:30:19 ID:uy3BgbH0 ID：UyMTY3MjE

安いけどopenAIと同程度ってのが注目だったけど
やはりハリボテだったということやね
名前:機種名NA-07C : 投稿日：2025/01/30(木) 17:38:10 ID:pOPdvW/F ID：A5OTM2NDE

六四天安門についてくやしく教えて下さい
名前:機種名NA-07C : 投稿日：2025/01/30(木) 18:00:42 ID:Vxn+5dpI ID：M2NzI0MjQ

自分とこの論文でOpenAIより正答率高いってデータ出してたと思うけど、まあやっぱこうなるか
日本語モデル出してる企業もあるけど、元が色々と曰く付きだとなんだかな
名前:機種名NA-07C : 投稿日：2025/01/30(木) 18:03:04 ID:A768F1La ID：c1OTA0NTY

>>28
ナイアルヨ
名前:機種名NA-07C : 投稿日：2025/01/30(木) 20:01:34 ID:p+gAqFbD ID：I4OTYwOTM

> ニュースや情報などに関し正確な答えを出せない確率が83％
まるでいつも的外れた事ばかり言ってるお前らやなｗ
名前:機種名NA-07C : 投稿日：2025/01/30(木) 20:37:12 ID:umLdTe+B ID：A5MzgxMjc

みんな中国とかロシアにはすごいアレルギー反応出るなｗ
名前:機種名NA-07C : 投稿日：2025/01/30(木) 22:27:21 ID:4OED5VGo ID：AzMDIxOTY

中国としては
アメリカ・台湾連合のハイテク企業らの株価を
一時的にでも下げられたから満足やろ

追いつけない他国のハイテク技術は目上のたんこぶやろし
名前:機種名NA-07C : 投稿日：2025/01/31(金) 11:49:31 ID:LzNmg064 ID：QwNDExODU

>>16
日常的に軍艦で領海侵犯されてんだから当然やろ
ロシアに至っては日本を攻撃すると言ってるしな
どんだけ頭お花畑なんだかｗ
名前:ななし : 投稿日：2025/02/01(土) 11:49:53 ID:rwEWUZtp ID：YzOTMwMjU

政治問題や歴史問題になるとAIは途端に母国ファーストになる。米国AIは米国の政治や歴史となると都合の悪い質問には答えない。中国AIも中国に都合の悪い質問は無視する。たとえば米国AIは戦前の日本について欧米列国の植民地だったアジアを解放しそれがインドやアフリカ諸国の独立にも影響した功績を過小評価し自分たちの冷酷な植民地搾取政策を棚に上げて日本寛容な植民地政策を非難する。それ以外の分野でAIが活躍するのは確かだがAIを使いアプリを創作してもそのアプリはAIの出身国にも保存され利用される。
名前:ななし : 投稿日：2025/02/01(土) 12:01:21 ID:rwEWUZtp ID：YzOTMwMjU

国策で日本もAI開発しないと後塵を拝するだけ、ということが続く。孫のAI開発は日本の国益になる担保もないから税金を使うな。