BERT や GPT の登場により、テキストを扱うモデルは大きく発展しましたが、否定というごくありふれた操作を扱うのが依然難しいです。 本稿では、その理由と、部分的な解決策を紹介します。 目次 目次 否定文を理解できないAIたち 否定文を理解できずに困ること なぜ否定文をうまく扱えないのか なぜたまに成功するのか 対処法 ファインチューニング プロンプトの工夫 否定文を意識した訓練 文書数を増やす クエリとキーを拡張する おわりに 否定文を理解できないAIたち BERT (tohoku-japanese-v3) で A =「私はお寿司が好きです。」 B =「私の好きな食べ物はお寿司です。」 のテキスト埋め込みのコサイン類似度を求めてみましょう。A と B は同じようなことを言っており、予想されるようにコサイン類似度は 0.9695 と高いです。 では、 A =「
11月5日の米大統領選挙の投票日が目前に迫る中、フェイスブックには、「選挙が不正に操作される」もしくは「延期される可能性がある」といった虚偽の主張を含む数百件の広告が掲載されている。 フェイスブックの親会社であるメタの広告ライブラリによると、これらの広告の背後にいるFacebookページは、同社に100万ドル(約1億5000万円)以上の広告掲載料を支払っている。また、その額は過去1週間だけで35万ドル(約5300万円)を超えている。 ある広告には、カマラ・ハリス副大統領が悪魔の角をつけ、背後でアメリカ国旗が燃えている画像が使用されている。他にも、人工知能(AI)で生成されたと思われる、ハリス副大統領が病院で泣き叫ぶ子どもたちに注射をしようとしている画像を使用した広告などが確認できた。 メタは、「投票の日程や場所、時間、方法に関する誤情報」や「候補者が出馬するかどうかに関する誤情報」を含む投
オープンAIは最新の資金調達ラウンドで66億ドル(約9600億円)を確保した。企業価値は1570億ドルと評価された。生成人工知能(AI)の分野で世界トップクラスの技術を構築する同社の取り組みはいっそう強化されることになる。 今回の取引によりオープンAIは、イーロン・マスク氏の宇宙開発企業スペースX、「TikTok(ティックトック)」を運営する中国のバイトダンス(字節跳動)に並び、ベンチャーキャピタルが支援する3大スタートアップの1社となった。投資規模はAIの力に対するテクノロジー業界の信頼と投資意欲の強さを示す。 資金調達ラウンドは、ジョシュ・クシュナー氏が率いるベンチャーキャピタル、スライブ・キャピタルが主導。コスラ・ベンチャーズ、アルティメーター・キャピタル、フィデリティ・マネジメント・アンド・リサーチなどの投資家が参加した。 既に130億ドルを投資しているマイクロソフトは今回、約7億
この他にも“コカインをキメるビル・ゲイツ氏”や“トランプ氏にナイフを突きつけるバラク・オバマ氏”などに見える画像もある。 xAIの利用規約には、ユーザーは「入力内容で言及または記載されている識別可能な自然人全員から、当該自然人の名前、声、肖像を本サービスおよび本規約で想定されている方法で使用することについて書面による同意を得ており、当該自然人は当該使用に関連して発生する可能性のあるあらゆる責任からお客様を免除している」ことを証明する必要があるとなっているが、少なくとも上の3つ目の画像が“当該自然人”から書面による同意を得ているとは思えない。 ちなみに、ChatGPT(DALL・E 3)に個人名を挙げて絵を描くよう頼むと「特定の有名人を直接描写する画像は作成できません」と断られるし、ミッキーマウスの絵についても「申し訳ありませんが、ミッキーマウスのような著作権で保護されたキャラクターの画像を
衆議院議員の玉木雄一郎氏(国民民主党代表)は8月1日、ChatGPTのAIゆういちろう」を休止した。「ChatGPTの政治キャンペーンへの利用ができないとOpenAIから指摘を受けた」ためという。 今後、LLMをGoogleの生成AI「Gemini」に変更し、近日中に再スタートする予定だという。 AIゆういちろうは、玉木氏の過去の国会での発言などを学習させたChatGPTベースのAI bot。テキストか音声で入力した政策についての質問に回答できるサービスとして、7月8日に公開した。 ただ「プロンプトを調整すれば、政策に無関係な質問でもChatGPTの回答が得られる」と話題になり、そうした利用を試すユーザーも相次いだ。 そのためもあってか、運用開始から8日で12万件を超える利用があり、「
Googleは、オープンソースのプロジェクトにおいてメンテナが行っているさまざまな作業を、生成AIなどによる支援で軽減する「Project Oscar」を、インドのバンガロールで行われたイベント「Google I/O Conプロジェクトには、Issueやプルリクエストやフォーラムでの質問などがコントリビュータから寄せられるため、メンテナはこれらに目を通して、不足している情報があれば指摘し、関連する情報があれば補足し、質問に返答するなど、コードを書く以外のさまざまな作業をしなくてはなりません。 プロジェクトが大きくなればなるほど、こうした作業の負荷は大きくなっていきます。 これらの作業を軽減し、コードを書くという最も楽しい作業に多くの時間をメンテナが割けるように支援するのが「Project Oscar」だと説明されていま
たまにウソつく生成AIに「契約書管理」は無理? 「40年の歴史」持つ言語解析AIが再評価されるワケ:万能ではないからこそ(1/5 ページ) 2022年末のChatGPTの登場以来、ビジネスの世界では生成AI技術の可能性に沸き立っている。多くの企業が競うように最新のAI技術を自社サービスに組み込み、イノベーションの波に乗ろうとしている。しかし、生成AIが万能かというとそんなことはない。 Sansanが2022年にリリースした契約書管理サービス「Contract One」は、最新の生成AI技術だけでなく、40年の歴史を持つルールベースの言語解析技術を中核に据えている。なぜSansanはこのような選択をしたのか。 契約書関連の業務をデジタル化する、いわゆるリーガルテック市場は活況だ。コロナ禍に急速に普及した電子契約を皮切りに、人間に代わりAIが契約書のレビューをサポートする契約書レビュー、締結し
udm14.com このサイトのドメイン名にもなっている「&udm=14」とは何かということだが、その前に the disenshittification Konami code というサイト名にも注意する必要がある。 disenshittification とは、ワタシも何度も(その1、その2)取り上げているコリイ・ドクトロウによるオンラインプラットフォームの質低下を指す造語 enshittification(メタクソ化)の対義語である。 そして、Konami code だが、もちろんコナミに由来する言葉で、いわゆる「隠しコマンド」全般を指すフレーズになってるそうな。 つまりは、「メタクソ化に抗う隠しコマンド」、それが「&udm=14」というわけだ。サイトデザインを見れば分かることだが、ここで対象となっているのは Google である。 検索エンジンとしての Google の質低下につい
www.nytimes.com 一部の AI 企業が「オープンソース」の看板をユルユルに使っていることに対する批判を取り上げた記事だが、まさにワタシが WirelessWire News 連載やこのブログで以前に取り上げた問題ですね。 オープンソース AI の支持者たちは、その方が社会にとってより公平で安全だと言うが、一方で反対者たちは悪意をもって悪用される可能性が高いと言う。この議論にはひとつ大きな問題がある。オープンソース AI が正味のところ何なのか合意された定義が存在しないのだ。それに AI 企業を――「オープンソース」という言葉を使って自分たちを不誠実にもよく見せようとする――「オープンウォッシング(openwashing)」と非難する声もある(オープンウォッシングという非難は、オープンソースの看板をあまりにも緩く使ったコーディングプロジェクトに向けられたことがある)。 ようやく
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く