1級FP技能士・FP技能士センター正会員。中央大学卒業後、フィンテックベンチャーにて証券会社の設立や事業会社向けサービス構築を手がけたのち、2022年4月に広告枠のマーケットプレイスを展開するカンバンクラウド株式会社を設立。本円にして5000億円程度まで伸びていた。
誤った記事が掲載された「福岡つながり応援」のサイト画面。福岡市や福岡県飯塚市の後援が表記されているが、現在は消えている 福岡県の魅力を発信する目的で今月開設されたサイトに、実在しない観光名所やご当地グルメが紹介された。記事は生成人工知能(AI)で作成していたといい、サイトを運営していた東京のウェブ関連会社は、事実と異なる記事だったとして全記事を削除して謝罪。サイトを後援していた福岡市と福岡県飯塚市は、事態を重く見て後援を相次いで取り消した。魅力を伝えるはずが、なぜ誤情報の発信となったのか。 問題となったのは「官民連携」のキャンペーンをうたうインターネットサイト「福岡つながり応援」。沖縄や宮城、山口各県の応援サイトを運営するウェブ関連会社が、11月1日から福岡県向けを新たにスタートさせ、県内の観光情報を掲載した。 ところが、閲覧者が保存した画像によると、福岡市の紹介記事では、アミューズメント
どんな人向けの記事? 医薬品のような難しい検索ニーズにこたえるためにベクトル検索を利用する知見を見てみたい MySQLの全文検索と、ベクトル検索の精度や速度を比較してみたい ベクトルDBとEmbeddingモデルを利用した簡単なベクトル検索の実装方法を知りたい 医薬品の検索ニーズは多様なので、ベクトル検索で解決できるか試したい 1つの医薬品を指す名称は、複数存在するため医薬品検索は意外と面倒な問題です。 例えば、日本人なら頭痛や生理痛、発熱したときに「ロキソニン」を飲んだことがあるかもしれません。この名称は商品の名称ですが、成分の名称は「ロキソプロフェンナトリウム水和物」です。 さらに、ロキソプロフェンには錠剤以外にもテープやパップといった剤形の違いがあります。 そして最後に、ロキソプロフェンを作っている会社は複数あるので、末尾に「トーワ」や「ファイザー」などの組み合わせが存在します。ロキ
はじめに ソースコードをLLMに読んでもらうとき、単一ファイルだと楽なのですが、GitHubのリポジトリのように複数ファイルから構成されるプロジェクトだと困ってしまいますね。 リポジトリごとLLMに読んでもらえるようにいい感じにテキスト化できると良いですね。そんなソフトがありました。しかも2つ。 両方ともほとんどコンセプトは同じです。特に後者のgenerate-project-summaryは使い方も含めて、自分のやりたいことが、すでに開発者の清水れみおさんが以下の記事にまとめていました。 なので、あんまり書く必要ないのですが、せっかくなのでgpt-repository-loaderの使い方と、出力したファイルの別の活用方法について書いてみたいと思います。 gpt-repository-loaderでリポジトリをテキストに変換 使い方はREADMEに書いてあります。シンプルなソフトなので、
これまで明確な定義がなかった「オープンソースAI」の定義をオープンソース・イニシアティブ(OSI)が発表した。テック企業が「オープンソース」という言葉を都合よく使っているとの批判への回答となるか。 by James O'Donnell2024.08.26 13 この記事の3つのポイント オープンソースAIの定義がOSIにより発表された 定義はAIモデルの使用、検査、修正、共有の自由を規定している 訓練データの透明性については意見の相違があり折衷案となった summarized by Claude 3 オープンソースAIは現在、至る所に存在する。問題は、実際のところそれが何なのかということについて、意見が一致していないことだ。今、私たちはようやくその答えを得られたかもしれない。オープンソースであることの意味の裁定者を自任するオープンソース・イニシアティブ(OSI)が、新しい定義を発表したのだ
研究チームは「カフェイン摂取により、夜眠れなくなり、遅寝・遅起きな生活リズムになってしまう可能性を示唆するだけでなく、カフェイン飲料への甘味の追加が、さらにその影響を悪化させることを示す結果」としている。 研究成果を発表したのは、広島大学大学院医系科学研究科、公衆衛生学の田原優准教授らの研究チーム。論文は学術誌「npj Science of Food」に19日付で掲載された。 【訂正:2024年8月20日18時24分更新 ※誤記を修正しました】 関連記事 「お酒のエナジードリンク割りは危険」農水省が注意喚起 原因はYouTuber? 問い合わせ相次ぐ お酒とエナジードリンクを一緒に飲むとカフェインの過剰摂取による健康被害につながりかねないとして、農林水産省が注意喚起している。5月8日に問い合わせが相次いだことを受けての対応で、同省は直前に人気YouTuberがお酒とエナジードリンクを一緒に
2024-07-13「大吉祥寺.pm」の発表資料です。 参考となる情報には
「なんとなく言語 (学) に興味がある人のためのブックガイド」をつくりました。 「なんとなく言語 (学) に興味があるのでもうちょっと読んでみたい」 「言語学にどんな分野があるのか知りたい」 「専門的に勉強したいというほどではないのだけれど、もうちょっと何か読んでみたい」 という人のために、言語 (学) についての入門的な本を紹介します。 これらの本を読んで言語 (学) っておもしろいなと思ったら、ぜひ大学などで言語学の授業を受けたり、専門的な入門書を読んだりしてください。 あるいは、以下の記事を参考に自分で言語学を勉強してみるとよいでしょう。 あくまで、なんとなく言語 (学) に興味がある人のためなので、注意点がいくつかあります。 網羅的なリストではありません。まだまだ編集中です。おもしろかった本があったら教えてください。 基本的に和書で、一般向けの本を紹介しています。 出版年順に並べて
現在 estie では、デプロイの改善・統一に取り組んでいます。複数プロダクトのそれぞれの技術スタックが大きく違う中、どう考えたら効率的なデプロイを組めるのか。2024年のデプロイの原則について、あらためて考えてみました。
もう全部OpenAIでいいんじゃないかな はじめに 月間技術革新です。 ということで、昨日OpenAIから発表された新しい動画生成AI「Sora」が非常に話題となっていますね。 圧倒的な一貫性の保持と1分間に及ぶ長時間動画が生成可能という事で、現状の動画生成技術を圧倒的に凌駕する性能を持っているようです。 在野エンジニアの小手先テクニックなど一笑に付すような圧倒的性能を Soraの凄さは色んなエンジニアやインフルエンサーがたくさん語っているのでそちらを見てもらうとして、この記事ではSoraを構成する各技術について簡単に解説していければと思います。 Soraの技術構成 論文が公開されているわけではないですが、OpenAIが要素技術の解説ページを公開してくれているため、そのページを参考にしていきます。 原文を見たい方はこちらからどうぞ 全体構成 Soraは以下の技術要素で構成されているとのこと
はじめに英語の論文をGPT4に執筆させた際の手順を記します。 普段からChatGPTを使っている人にとっては、当たり前のやり取りしかしていないのですが、意外と使えていない方がnon-AI分野では多いので、丁寧にプロンプトを示していきます。 (ワークショップで解説する必要が出てきたので、そのためのメモ書きです) GPT-4に論文は書けるのか?ゼロから書かせるのは難しいですが、日本語の下書きを英訳するのは得意で、少なくとも筆者が満足する品質のテキストが得られます。 GPTを使って執筆をするメリットDeepLやGoogle翻訳と違い、英文のスタイル(e.g., 論文調)を明示的に指示できるので、翻訳のクオリティが高い 日本語ネイティブにとっては、日本語で書いた方が圧倒的に楽※ スペルミスや文法ミスを犯さないので、校正の手間も減る。※ 基本的に翻訳タスクしか行っていないので、GPTが過去の類似文章
Amazon Web Services ブログ 日本語大規模言語モデル OpenCALM の知識でクイズ王に挑戦する 数十億を超えるパラメーターを持つ大規模言語モデルは、追加学習なしに人間も驚く知識を披露します。その知識で、クイズ王に輝くことはできるのでしょうか? 本記事では、株式会社サイバーエージェント様が公開した OpenCALM を用いてクイズを題材にした日本語 QA データセット JAQKET にどこまで正確できるか検証します。クイズに回答するのは、問い合わせ窓口での質問回答業務に近いタスクです。本記事の内容は、お客様対応等の業務を続々とオープンソースで公開される大規模言語モデルを利用してどのようにコスト効率良く改善するのかの検討にも活用頂けます。 OpenCALM は、株式会社サイバーエージェント様から 2023 年 5 月 11 日に公開された日本語大規模言語モデルです。Wik
はじめに ABEJAでデータサイエンティストをしている服部です。 今回はLLMで外部データを使うケースについてのお話をしたいと思います。 はじめに LLMと外部データの利用 RetrievalとLLM 0. (事前準備)参照したいテキストデータをDBに格納 1. ユーザの入力文とのテキスト類似度を計算して、関連テキストを抽出する(Retrieval) 2. 関連テキストをLLMのプロンプトに入れ込み、ユーザの入力文に回答する。 Retrieval時の課題 LangChainでの用意 Case1: それぞれの文章がRetrievalしにくい形で保存されている 対策案: ページ構造を意識した形で各文章を格納する 他の対策案 聞き方を明確にする 類似度を測るクエリ文章を置き換える 不要そうな文章をデータから削除する データ自体をLLMで整形し直す Case2: 未知の単語を含む 仮説: ニャオハ
※ 直近2年間で高度試験に合格していれば免除 攻略の定石 〜過去問〜 ChatGPTの話題の前に、受験する皆様に絶対に伝えておかねばならないネスペひいては情報処理技術者試験共通の対策定石があります。それは 過去問をやれ です。これに尽きます。 勉強スケジュールを決めるとか目標をどうのこうのとかありますがそれは人によって合う合わないがあります。 しかし過去問をやれだけは全人類共通の対策方法になります。特に午前問題は過去問に100%答えられるなら新規問題の割合は多くないので確実に合格します! 午後問題も、過去問と同じ単語を答えさせる問題が何回か出てくるので、「この単元・単語が好きなんだな」みたいな傾向がわかったりします。それ以上に 「どれぐらいの粒度でどのような観点の回答をすべきか」 を抑えることができるので、具体的な習得目標ができ、「全く過去問を解かなかった人」と比べると大きなアドバンテージ
はじめに Streamlit vs Gradio Gradioの設計思想 Interface 入出力に応じたUI Interface String Shortcut 入力データのサンプルのセット ドキュメンテーション テーマの変更 タイムアウトへの対処 中級者への第一歩、デモを作る際に知っておきたい処理 Gradioが担当する前処理について プログレスバー もろもろの出力結果を保存するには? 認証認可(というか認可) その他、解説しないが需要の有りそうなもの まとめ 追記 : 動画になりました。 はじめに 機械学習系のデモアプリを作成することがしばしばありStreamlitを使用していたが、パラメーターなどをいじるたびに処理が最初から走るなどといった挙動に悩まされていた。 同僚がGradioというのを使っていたのでサーベイがてらメモしていたらブログが出来上がってしまった。 本ブログでは、G
粘菌100万体の振る舞いを個別計算、ラット脳細胞で機械学習──ライゾマ真鍋氏が見せた「AIの少し先の未来」(1/4 ページ) 2022年の夏以降、世の中はAIアート作品の話題でもちきりだ。そんな中、AIブーム以前からAIを活用した作品も手掛けてきた真鍋大度氏の個展「EXPERIMENT」が4月から5月にかけて開催されていた。頭の中に浮かんだイメージを映像化した作品や、ラットの脳細胞をコンピュータ代わりに使う作品など、AIよりもさらに先の未来を予見させる作品ばかりだとして話題になった。 作品作りには高性能なコンピュータや光無線通信などの技術が必要だったが、2022年に設立されたソフトバンク先端技術研究所(以下、ソフトバンクR&D)がこうした技術を提供。まさに「技術の粋(すい)」が感じられる展覧会となった。そこで展示があった“AIの少し先の未来”を、ここでは詳しく紹介したい。 真鍋氏はクリエイ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く