
どんな質問で?
1: 名無しさん@涙目です。(愛媛県) [ニダ] 2025/01/30(木) 11:34:58.61 ID:tIPGaYyF0● BE:135853815-PLT(13000)
中国AI「ディープシーク」検証レポート“正確な答え出せない確率83%”
ウェブサイトの信頼性を評価する「ニュースガード」が29日に公表したレポートによりますと、ディープシークのAIアプリを検証したところニュースや情報などについての質問に対し虚偽の主張となる確率は30%、無回答となる確率が53%と正しい答えを出せない確率は83%に上ったということです。
![]()
ウェブサイトの信頼性を評価する「ニュースガード」が29日に公表したレポートによりますと、ディープシークのAIアプリを検証したところニュースや情報などについての質問に対し虚偽の主張となる確率は30%、無回答となる確率が53%と正しい答えを出せない確率は83%に上ったということです。

Yahoo!ニュース
Yahoo!ニュースは、新聞・通信社が配信するニュースのほか、映像、雑誌や個人の書き手が執筆する記事など多種多様なニュースを掲載しています。
2: 名無しさん@涙目です。(庭) [CN] 2025/01/30(木) 11:35:51.12 ID:JbOVn/SJ0
習近平はイケメンですか?
85: 名無しさん@涙目です。(光) [US] 2025/01/30(木) 12:15:25.61 ID:JwCEVAdy0
>>2
習近平はプーさんです
習近平はプーさんです
107: 名無しさん@涙目です。(ジパング) [ニダ] 2025/01/30(木) 12:39:16.39 ID:2PiWbiMy0
>>85
はい行方不明
はい行方不明
7: 名無しさん@涙目です。(東京都) [ニダ] 2025/01/30(木) 11:37:26.86 ID:TsgXuSgs0
アクセスするのも怖いな
11: 名無しさん@涙目です。(福井県) [AU] 2025/01/30(木) 11:38:41.43 ID:E6de6NQU0
いやLLMの性能を評価するって実際簡単じゃないと思うんだけど、
どうなんだろね
deep seekがopen AI上回った!って言い張ってるのはベンチマークの数字でしかないってのは当たり前な上で
どうなんだろね
deep seekがopen AI上回った!って言い張ってるのはベンチマークの数字でしかないってのは当たり前な上で
12: 名無しさん@涙目です。(みょ) [GB] 2025/01/30(木) 11:39:05.46 ID:AgG1pa1+0
たとえどんなに高性能でも中国政府の立場からしか話ができないならポンコツAIだろ
18: 名無しさん@涙目です。(庭) [US] 2025/01/30(木) 11:41:12.86 ID:BlqrMkmK0
いや問題はそこじゃなくてオープンライセンスってとこじゃないの?
コモディティ化を促進する戦略だよな
中国は米国の巨大企業のAI覇権を自分の力だけでなく、西側の新興企業と自由経済の力で崩そうとしてるって事だろ
コモディティ化を促進する戦略だよな
中国は米国の巨大企業のAI覇権を自分の力だけでなく、西側の新興企業と自由経済の力で崩そうとしてるって事だろ
21: 名無しさん@涙目です。(日本のどこか) [US] 2025/01/30(木) 11:42:09.08 ID:NqmDTMyD0
まあ今あるAIも平気な顔して嘘つくしお互い様アル
20: 名無しさん@涙目です。(ジパング) [US] 2025/01/30(木) 11:42:08.09 ID:qGVAXKi/0
しゃべっていいかどうか考えるのにリソース取られてるんだろう
24: 名無しさん@涙目です。(福井県) [AU] 2025/01/30(木) 11:43:40.13 ID:E6de6NQU0
ニュースのネタで評価するってさ、
中国AIが中国政府関連の事をまともに答えられないのをわかった上で
低い性能出すためにその評価方法にしたなんてことないよね?
中国AIが中国政府関連の事をまともに答えられないのをわかった上で
低い性能出すためにその評価方法にしたなんてことないよね?
34: 名無しさん@涙目です。(会社) [CN] 2025/01/30(木) 11:47:40.21 ID:MPzk7R3d0
>>24
それに答えられないのは立派な問題だと思うが
それに答えられないのは立派な問題だと思うが
117: 名無しさん@涙目です。(やわらか銀行) [US] 2025/01/30(木) 12:47:12.30 ID:gUfsEE4N0
>>34
他所のAIも米大統領選の質問には答えませんとかしてるよ?
他所のAIも米大統領選の質問には答えませんとかしてるよ?
29: 名無しさん@涙目です。(茸) [NL] 2025/01/30(木) 11:45:57.19 ID:RilmBGvt0
で、日本のAIは?
31: 名無しさん@涙目です。(鹿児島県) [GB] 2025/01/30(木) 11:46:14.47 ID:3GeVJiFF0
w
38: 名無しさん@涙目です。(ジパング) [US] 2025/01/30(木) 11:48:42.51 ID:+/2YKqtv0
突然、中国のAIが安価で凄いとか騒ぎ始めて変だと思ってたら
このザマw
このザマw
46: 名無しさん@涙目です。(みょ) [ニダ] 2025/01/30(木) 11:50:44.56 ID:N3906tUW0
難関大学の試験問題を正解するってのどこいったw
50: 名無しさん@涙目です。(茸) [BR] 2025/01/30(木) 11:51:58.00 ID:u95iMdiw0
プーさんについて教えて
63: 名無しさん@涙目です。(福岡県) [US] 2025/01/30(木) 12:02:47.91 ID:2HFep4W50
なんか中国のAI凄いとかEV凄いみたいな持ち上げ続いてたけど結局マネーゲームネタか
71: 名無しさん@涙目です。(東京都) [JP] 2025/01/30(木) 12:07:17.76 ID:1xePwXau0
GoogleAIが割と良い感じではないかと思う
俺達がググるのと大差ないというか
たまに間違ってるけど
俺達がググるのと大差ないというか
たまに間違ってるけど
79: 名無しさん@涙目です。(茸) [US] 2025/01/30(木) 12:13:04.13 ID:TCqyJZXt0
ディープシーク「正確な答えはオープンAIに聞け」
82: 名無しさん@涙目です。(庭) [ニダ] 2025/01/30(木) 12:13:59.10 ID:9Lh4EsEs0
ふつうに使えるけどな
83: 名無しさん@涙目です。(みかか) [US] 2025/01/30(木) 12:14:09.86 ID:fSzdJXub0
ニュースとか検索につかってるやつアホだよななにも使いこなせない
90: 名無しさん@涙目です。(庭) [EU] 2025/01/30(木) 12:17:33.43 ID:ghsYkEE20
やっぱ見た目上のスピードを速くするために手順をどっか省略してるんだな
で、答えがそれでも合う奴だけピックアップして速度比較w
で、答えがそれでも合う奴だけピックアップして速度比較w
95: 警備員[Lv.12][新](庭) [ニダ] 2025/01/30(木) 12:23:02.20 ID:+n04pmks0
一般人レベルより少しマシなくらいか
102: 名無しさん@涙目です。(庭) [CA] 2025/01/30(木) 12:32:34.50 ID:/Hp0U1WG0
AIの答えの信憑性は、まんま情報ソースの信憑性だからな
金盾の裏側だけでラーニングしてたらそうなるわな
金盾の裏側だけでラーニングしてたらそうなるわな
103: 名無しさん@涙目です。(ジパング) [UA] 2025/01/30(木) 12:32:46.73 ID:K5yIgEiP0
チャイナクオリティ
112: 名無しさん@涙目です。(茸) [ニダ] 2025/01/30(木) 12:41:58.43 ID:HgJq/bU80
家で眠ってるスマホをコンビニのWiFiに繋いで試してみるか
118: 名無しさん@涙目です。(庭) [ニダ] 2025/01/30(木) 12:47:52.77 ID:ay6+Hkc+0
まあ、安定の中華製だからなwww
108: 名無しさん@涙目です。(茸) [US] 2025/01/30(木) 12:39:40.82 ID:bKQ3Xss90
AI界の先行者か
俺にはもう中国仕草だと笑えないよ
俺にはもう中国仕草だと笑えないよ
129: 名無しさん@涙目です。(愛知県) [JP] 2025/01/30(木) 12:56:36.86 ID:ZhkdUBUR0
ほぼデタラメってか
いかにも中華製品らしいなw
いかにも中華製品らしいなw
133: 名無しさん@涙目です。(茸) [US] 2025/01/30(木) 13:00:02.80 ID:2F0Kw2EI0
急に正解率に関しての叩き記事が多くなってきた違和感w なんなんこれ
136: 名無しさん@涙目です。(庭) [US] 2025/01/30(木) 13:03:41.70 ID:YblnJWxX0
あまりの酷さに擁護勢が退散してるだけだぞ
137: 警備員[Lv.21](庭) [DE] 2025/01/30(木) 13:07:34.66 ID:Z+MDaQN20
立場で答えが変わるのはある意味人間に近付いた証拠だな
146: 名無しさん@涙目です。(やわらか銀行) [CN] 2025/01/30(木) 13:34:40.04 ID:3PmtBu+60
中国にはお似合いのAIだったね
144: 名無しさん@涙目です。(ジパング) [CL] 2025/01/30(木) 13:23:44.24 ID:yRQdHJP60
なんでNVIDIAの株価落ちたんだよ!
引用元:・https://hayabusa9.5ch.net/test/read.cgi/news/1738204498/



コメント
> なんでNVIDIAの株価落ちたんだよ!
投資家が儲けるために情報利用したからだよ
株価なんて水物
去年の最初にもう終わりだと言われてた銘柄だしな
爆発する心配がないだけまし
事実を確認する問題が苦手なのはそのとおりだが推論は強いのでプログラミングではGhatGPTより劣ってるものの僅差で、数学ではGhatGPTより正答率が高い
得意不得意が違うだけで総合的な性能は互角だよ
苦手なところをクローズアップしてネガキャンしてるだけ
パープレでR1とo1を交互に使ってみたが、R1はちょっとハルシネーションが酷い気がした
基本有能なのにとんでもない嘘を混じって回答出すからちょっと怖い
推論が得意でも前提を間違えてたらそりゃああかんわ
天安門事件も答えられないAIじゃゴミでしょ
※6
オープンソース版は多分答えられるでしょ
尖閣諸島は日本領だと答えるし、過去に中国側が日本領であると認知していたことにも触れてた
>>7
検証済み
一生懸命学習させてるやつ居るけど結果は知らないw
まあ先行者だよね。最初バカにしてたのに数年後にはもう誰もバカにできない水準に達してる
>>9
中国共産党を批判できるAI作れるならね
安いけどopenAIと同程度ってのが注目だったけど
やはりハリボテだったということやね
六四天安門についてくやしく教えて下さい
自分とこの論文でOpenAIより正答率高いってデータ出してたと思うけど、まあやっぱこうなるか
日本語モデル出してる企業もあるけど、元が色々と曰く付きだとなんだかな
>>28
ナイアルヨ
> ニュースや情報などに関し正確な答えを出せない確率が83%
まるでいつも的外れた事ばかり言ってるお前らやなw
みんな中国とかロシアにはすごいアレルギー反応出るなw
中国としては
アメリカ・台湾連合のハイテク企業らの株価を
一時的にでも下げられたから満足やろ
追いつけない他国のハイテク技術は目上のたんこぶやろし
>>16
日常的に軍艦で領海侵犯されてんだから当然やろ
ロシアに至っては日本を攻撃すると言ってるしな
どんだけ頭お花畑なんだかw
政治問題や歴史問題になるとAIは途端に母国ファーストになる。米国AIは米国の政治や歴史となると都合の悪い質問には答えない。中国AIも中国に都合の悪い質問は無視する。たとえば米国AIは戦前の日本について欧米列国の植民地だったアジアを解放しそれがインドやアフリカ諸国の独立にも影響した功績を過小評価し自分たちの冷酷な植民地搾取政策を棚に上げて日本寛容な植民地政策を非難する。それ以外の分野でAIが活躍するのは確かだがAIを使いアプリを創作してもそのアプリはAIの出身国にも保存され利用される。
国策で日本もAI開発しないと後塵を拝するだけ、ということが続く。孫のAI開発は日本の国益になる担保もないから税金を使うな。