You are currently viewing ChatGPTの主要マイルストーンと2024年に向けたジェネレーティブAI

ChatGPTの主要マイルストーンと2024年に向けたジェネレーティブAI

ChatGPTのローンチから1年以上が経過したが、AIの進歩のペースは他に類を見ない。リリースから5日間で、このチャットボットは100万人以上のユーザーを魅了し、日常のタスクをアシストした。

ChatGPTのバイラルな人気は、印象的な言語能力と一般へのアクセシビリティに起因している。以前のGPT-3のような他のAIモデルは研究者や開発者が利用できるものでしたが、ChatGPTは会話AIを初めて一般の人々に開放したのです。

ChatGPTの登場は、AIを身近なものにするマイルストーンとなった。本記事では、ChatGPTと2024年のジェネレーティブAIのトップ・モーメントを探る。

ChatGPTはOpen AIによって開発されたAIチャットボットで、人間のようなテキストを生成し、与えられたプロンプトごとにインテリジェントでコンテキストを意識した応答を提供する。

ChatGPTのベーシック・バージョンは自由に利用でき、拡張版のChatGPT Plusサブスクリプションは月額20ドルで高度な機能を提供する。

メタ、マイクロソフト、Xといった著名企業がOpenAIに多額の投資を行っており、2018年にはGenerative Pre-Trained Transformer(GPT)を発表した。膨大なデータセットで訓練されたこのモデルは、人間の認知プロセスをエミュレートすることを目的としている。

OpenAIは機械学習、深層学習、自然言語処理を専門としており、ChatGPTは複数の言語で世界的に利用可能だ。このツールは急速な普及を目の当たりにし、2022年11月の発売から5日間で100万人のユーザーを集めた。

GPTシリーズには、GPT-3.5 Turbo、GPT-4、GPT-4 Turbo、GPT-4V Turbo、GPT-4o、Sora、Whisper、DALL-E3があり、OpenAI APIも含まれています。ChatGPTはカスタムモデルの作成と微調整をサポートしています。

現在GPT-3.5アーキテクチャで動作しているChatGPTは、質問応答、創造的なライティング、要約や翻訳などの実用的なタスクなど、様々なアクティビティでのインタラクションをガイドする、ユーザーのプロンプトを理解し応答することに優れています。

ChatGPTは継続的な改善のために設計されており、ユーザーとのインタラクションやフィードバックを通じて会話能力を磨き、ユーザーとのエンゲージメントにおけるパフォーマンスと関連性を高めています。

2024年3月の最新データでは、ChatGPTのユーザー数は1億8,050万人でした。2024年1月、OpenAIの公式ウェブサイトは16億のアクセスを集めました。ピーク時の2024年4月時点で、OpenAIのサイトには毎月20億のアクセスがあった。

OpenAIのプラットフォームは、フォーチュン500企業の92%以上に利用されており、マーケティング部門は77%でChatGPTの採用をリードしています。

ChatGPT-ユーザー統計-2024

Similarwebによると、chat.openai.comには過去1ヶ月で約6億件のアクセスがあったという。このサイトの直帰率は32.36%です。平均して、訪問者は各セッションで3.89ページを閲覧し、サイト滞在時間は約7分32秒です。

ChatGPTへの訪問の70.56%は直接アクセスで、20.98%はオーガニックアクセスです。人気のあるChatGPTのマーケティングチャンネルでは、ソーシャルメディアからのトラフィックが4.18%(YouTubeからのトラフィックが47.96%で最高)、リファラルからのトラフィックが3.94%となっています。

ChatGPTユーザーが最も多いのは米国で31.1%。2位のニュージーランドのユーザー数は7.36%で、かなり少ない。上位5カ国を合計すると、全ChatGPTユーザーの約33.36%を占めています。

OpenAIがRocksetを買収

マイクロソフトが支援するOpenAIは2024年6月21日、検索インフラを強化し、AIをより役立つものにするため、Rocksetを買収した。

Rocksetは世界トップクラスのインデックス作成とデータベース分析に特化したスタートアップで、ChatGPTはエンタープライズ製品のインフラ強化を目指している。

Rocksetは、ユーザー、開発者、企業がリアルタイム情報にアクセスしながらデータを活用し、よりインテリジェントなAIアプリケーションを構築できるようにする。

主要機関や情報筋は、OpenAIがRocksetを数億ドルで買収したことを明らかにした。

Rockset社は元Meta社のエンジニアによって設立され、チャットボットから異常検知まで幅広いAIアプリケーションを構築してきた。

リアルタイム検索と分析データベースを開発している。昨年、 Hewlett Packard Enterprises、Sequoia、Greylockなどの企業の支援を受け、1億500万ドルの資金を調達した。

OpenAIとアップルが提携を発表

2024年6月10日、OpenAIとアップルは、iOS、iPadOS、macOSを含むアップルのエクスペリエンスにChatGPTを統合するためのパートナーシップを発表した。これにより、ユーザーはツール間を飛び越えることなく、ChatGPTの画像とドキュメント理解機能にアクセスできるようになります。

GPT-4oによるChatGPT統合は今年後半に登場する予定だ。ユーザーはアカウントを作成することなく、無料でアクセスできるようになる。

既存のChatGPT加入者は、iOS、iPadOS、macOSからアカウントを接続し、プレミアム機能にアクセスできるようになる。

アップルはWWDC 2024で、ChatGPTをSiriにも導入することを発表した。Siriは、ユーザーが文書や写真を送信する際に、ユーザーの許可を得た上で答えを提示する。

ChatGPTはまた、Appleのシステム全体のライティングツールでも利用できるようになり、ユーザーが書くあらゆるもののコンテンツを生成するのに役立ちます。

ChatGPTの画像ツールを使えば、ユーザーは自分の文章を補完する様々なスタイルにアクセスすることもできる。しかし、リクエストは保存されず、ユーザーのIPアドレスは隠蔽されるため、ユーザーのデータはChatGPTポリシーの下で保護されます。

ChatGPTアカウントを接続するオプションは、自動的にChatGPTのプライバシー保護ポリシーの下でデータ設定を移行します。

ChatGPTのデータ分析の改善

OpenAIは2024年5月16日、ChatGPTのデータ解析のアップデートと改善を発表しました。これらの改善は、ChatGPT Plus、Team、Enterpriseユーザー向けのフラッグシップモデルGPT-4oで利用可能です。

ユーザーは、Googleドライブ、Microsoft OneDrive Personal、Microsoft OneDrive(Sharepointを含む)から最新バージョンのファイルを直接アップロードできます。また、拡張可能なビューで表やグラフを操作したり、カスタマイズしたり、プレゼンテーション用のチャートやドキュメントをダウンロードすることもできます。

OpenAIとThe Atlanticの戦略的コンテンツ&製品パートナーシップ

OpenAIは、何百万人ものユーザーに対して、レポートやストーリーをより発見しやすくすることを目的としている。2024年5月29日に発表されたThe Atlanticのパートナーシップは、OpenAIのプレミアムニュースソースとして位置づけられました。

パートナーとして、The Atlanticの記事はOpenAIの製品、特にChatGPTの中で発見できるようになる。これは、将来のリアルタイムディスカバリープロダクトにおけるニュースの浮上という視点を形成するのに役立つだろう。The Atlantic “で表示されるクエリには、帰属表示と公式サイトで記事全文を読むためのリンクが含まれます。

この契約の一環として、The Atlanticの製品チームはOpenAIの技術に特権的にアクセスできる。The Atlanticは、フィードバックを提供し、ユースケースを共有することで、ChatGPTや他のOpenAI製品における将来のニュース体験の改善と形成を支援します。

The Atlanticの実験的マイクロサイト “Atlantic Labs “は、AIが読者やジャーナリズムのための新しい製品や機能の開発にどのように役立つかを解明するために開発され、テストされている。彼らはOpenAIや他の新興技術をこの仕事に試験的に導入する予定だ。

OpenAIとRedditのパートナーシップ

Redditには、研究を通じて人間の学習を促進するコンテンツを持つ活気あるコミュニティがある。AI、LLM、MLを利用することで、Redditはすべての人のユーザー体験を向上させることができる。このため、RedditとOpenAIは2024年5月16日、両コミュニティに利益をもたらすパートナーシップを発表した。

OpenAIがChatGPTと新製品に強化されたRedditコンテンツをもたらすことで、ユーザーはRedditコミュニティを発見し、参加することができるようになる。

Redditからリアルタイムで構造化されたユニークなコンテンツを提供するRedditのData APIは、OpenAIによってアクセスされ、最近のトピックの内容をより良く理解し、紹介することができるようになります。

OpenAIはRedditの広告パートナーとなるだけでなく、AIを活用した新しい機能をRedditのユーザーやMODに提供する手助けをする。Redditはそのビジョンを達成するためにOpenAIのAIモデルを利用する。

フラッグシップモデルGPT-4oの紹介

GPT-4(”o “は “Omni “の意)は2024年5月13日に発売され、GPT-4レベルのインテリジェンスを提供する。テキスト、音声、視覚の各機能が向上し、テキスト、音声、画像を自由に組み合わせて出力する。

ただし、現在、ChatGPTプラス加入者が利用できるのは、新しいテキストと画像の機能のみである。

音声入力では平均320ミリ秒、テキストとコードではGPT-4ターボの性能に匹敵します。既存モデルと比較して、GPT-4oは視覚と音声に優れています。非英語のテキストでは大幅な改善が見られ、APIではより高速で50%安価です。

GPT-4oは、テキスト、視覚、音声にわたる単一のエンドツーエンド・モデルで学習されます。したがって、すべての入力と出力は同じニューラルネットワークによって処理される。

このモデルはまた、テキスト評価、オーディオASR、オーディオ翻訳、視覚理解Evals、およびM3Examゼロショット結果で新たな高いウォーターマークを設定しながら、GPT-4ターボレベルのパフォーマンスを達成しました。

また、平均よりも少ないトークンを使用する様々な言語ファミリーにまたがる新しいトークナイザーの圧縮を表現するために、20の言語が選ばれました。

バイアスと公平性、社会心理学、新しいモダリティを増幅させるリスクの特定などの領域における70人以上の外部専門家によって、GPT-4は大規模な外部レッドチームを受けています。OpenAIはGPT-4oと対話するための安全介入を学び、構築し続けます。

ChatGPTプラスユーザーは無料ユーザーの5倍のメッセージ制限があります。チームとエンタープライズのユーザーは、さらに高い制限があります。

OpenAIは、ユーザーがサインアップすることなく、より簡単にAIの恩恵を受けられるようにすることを目的としています。

2024年4月1日から、OpenAIはChatGPTの機能に対するユーザーの好奇心を満たす機能を展開しました。185カ国で毎週1億人以上がChatGPTを利用しています。

ユーザーは即座にChatGPTを使用することができますが、アカウントを作成してもしなくても設定からオフにすることができます。

アカウントを作成するメリットは、チャット履歴の保存や確認、チャットの共有、音声会話やカスタム指示などの機能ブロックの解除などがある。この体験のために、OpenAIは、より幅広いカテゴリのプロンプトや世代のブロックを含むコンテンツセーフガードを導入している。

OpenAIは2024年3月4日、Web、iOS、Androidアプリで利用可能な新機能として、チャットを音声で読み上げる機能をXに掲載しました。

この機能により、ChatGPTは回答を5つの選択肢から選び、37の言語で読み上げることができる。OpenAIは、業界をリードするキャスティングや演出の専門家と協力し、400以上の応募の中から5つの音声を選びました。読み上げ機能はGPT-4とGPT-3.5の両モデルで利用可能です。

音声機能は2023年9月にユーザーに導入された。Breeze、Cove、Ember、Juniper、Skyを含む各ボイスは、OpenAIが提携した声優からサンプリングされたものです。

OpenAIは、物理的な世界の動きを理解し、シミュレーションするためのAIを教える研究を行った。トレーニングモデルが、現実世界でのインタラクションを必要とする問題を解決する手助けになることを目指した。

2024年2月15日に発表されたSora AIは、印象的な動画を生成することができる。ユーザーの指示に従いながら、鮮明なディテール、カメラの動き、キャラクターの生き生きとした感情など、最大1分の動画を作成することができる。

また、1つのビデオ内に複数のショットを作成し、登場人物とそのビジュアル・スタイルを正確に描写することもできます。

危害とリスクの重要な領域を評価するために、OpenAIはSoraをチームメンバーに公開した。特定のビジュアルアーティスト、デザイナー、映画制作者も、モデルを進化させるためのフィードバックを提供し、クリエイティブなプロフェッショナルに役立つようにするためのアクセス権を与えられている。

テキスト・トークンを使用する大規模言語モデルとは異なり、Soraはビジュアル・パッチを利用する。これらのパッチは、動画を低次元の潜在空間に圧縮し、時空間パッチに分割することで作成され、多様な視覚データに対してスケーラブルで効率的な学習方法を提供する。

Soraは、視覚データを時間的・空間的に圧縮するネットワーク上で動作する。さらに、潜在情報をピクセル空間に復元するデコーダも含まれている。

OpenAIはまた、正確なテキスト説明を生成する高度なキャプションモデルを使用して、DALL-E3のリキャプション技術を動画に実装することで、SORAの機能を強化しました。

現在のモデルにはまだ改善の余地があり、原因と結果の具体的な例を理解したり、空間的な詳細を混乱させたり、時間の経過とともに展開する出来事の正確な説明を理解したりするのに苦労するかもしれません。

メモリと新しいコントロール機能

OpenAIは、ChatGPTが物事を記憶し、将来のチャットをより役立つものにする能力をテストしました。

ChatGPTの記憶機能は2024年2月13日にロールアウトされ、ユーザーは設定を通じてChatGPTに何かを記憶するよう明示的に指示したり、何を記憶しているか尋ねたり、会話を忘れるよう指示したりすることができます。ユーザーはこの機能をすぐにオフにすることもできます。

この機能は、OpenAIがその有用性を学ぶために、2月の週に一部のChatGPT無料ユーザーにロールアウトされました。ブローダープランは間もなく展開される予定です。

ChatGPTのメモリーは特定の会話にリンクされていません。チャットを削除してもメモリは消えないので、メモリ自体を削除する必要があります。

モデルを改善するために、ChatGPTはメモリを含むコンテンツを使用することがあります。ただし、ChatGPTチームとエンタープライズの顧客のコンテンツではモデルは学習されません。

ユーザーはデータコントロールからメモリコントロール機能をオフにすることができます。ユーザーがメモリなしの会話を好む場合、一時的なチャットを選ぶことができます。一時的なチャットは履歴に表示されず、メモリを使用せず、モデルの学習には使用されません。

カスタム指示は、ユーザーがChatGPTに自分の何を知ってほしいか、どのように応答してほしいかを直接指示することができます。明示的な情報や指示は、カスタム指示に追加することができます。

2024年1月10日に開始された革新的なGPTストアは、ユーザーがOpenAIやそのパートナー、ChatGPTユーザーによって開発された様々なGPTモデルを探索できる中心的なハブとして機能します。

ナビゲーションを容易にするために、モデルはライティング、生産性、研究と分析、プログラミング、教育、ライフスタイルなどのカテゴリに整理されています。

これらの中で特筆すべきは、ロゴを作成できるChase Leanによるロゴクリエーターと、Canvaのウェブサイト上でさらにカスタマイズできるグラフィックをデザインするためのツールを提供するCanvaです。

GPTストア-2024-1月号

ChatGPTの利用が様々な組織で拡大するにつれ、OpenAIはコラボレーションツールの強化の必要性を認識し、チームプランを導入しました。

このプランでは、様々な規模のチームがGPT-4、DALL-E 3、Advanced Data Analysisのような高度なモデルや機能にアクセスすることができ、GenAIツールの可能性を最大限に引き出す専用のコラボレーションワークスペースも利用できます。さらに、チーム管理を合理化するために設計された管理ツール群も含まれています。

ChatGPTエンタープライズと同様に、チームプランはユーザーがデータの所有権とコントロールを維持することを保証します。このプランを選択することで、ChatGPTがあなたの会話やその他のビジネスデータをトレーニング目的で使用しないことが保証されます。

ChatGPTが2024年に新しいアップデートを展開することは、ジェネレーティブAIの分野での重要な進歩を意味します。

GPTストア、チームプラン、様々なパートナーシップ、そして期待されるGPT-5を含む今後のモデルのような機能の導入は、個人と組織の両方の生産性と効率を高めるように設定されています。

これらの開発は、ジェネレーティブAIツールが未来を形作る可能性を予見させるものです。

ChatGPTの所有者は誰ですか?

サム・アルトマン、イーロン・マスク、ピーター・ティール、イリヤ・スーツケバー、ジェシカ・リビングストン、リード・ホフマン、グレッグ・ブロックマン、ヴォイチェフ・ザレンバ、ジョン・シュルマンといった著名人が2015年に設立したAI研究機関OpenAIがChatGPTのオーナーです。

ChatGPTの最新モデルとは?

GPT-4oは、GPT-4レベルのインテリジェンスと強化されたスピードと効率を提供することで、無料ユーザーに大幅なアップグレードを提供します。2024年5月13日(月)に発表されたGPT-4oは、OpenAIのこれまでで最も高速で強力な大規模言語モデル(LLM)とされています。

GPT-4は2024年にアップデートされたのですか?

2023年4月までしか更新されていなかった前バージョンと比べ、今回のアップグレードは2024年4月までのデータで学習されていることが重要です。今回のアップデートは、OpenAIがGPT-4 with Vision APIを開発者アカウントに広くリリースしたことに続くものです。

ChatGPTはどの国で最も利用されていますか?

ChatGPTは188カ国で利用されており、最も多いのはアメリカ(16.49%)、次いでインド(7.42%)、フィリピン(3.6%)、コロンビア(3.47%)、カナダ(3.11%)となっています。

OpenAIはRedditを利用していますか?

OpenAIは、Redditの結果を表示することで得られるPerplexityの優位性を排除するために、RedditのデータAPIにお金を払うことを計画している。Googleの新しい検索開発に影響を受け、”wow “要素を高めるために検索機能を強化することにしたようだ。

OpenAI Soraは利用できますか?

OpenAIは、2024年に予定されているSoraの一般公開日をまだ発表していないが、現在は特定のユーザーがアクセス可能である。同社は懸念に対処し、積極的な用途を特定するために、重要な安全対策を講じている。ビジュアルアーティスト、デザイナー、映画制作者も、クリエイティブな専門家のためのモデルを進化させるためにフィードバックを提供している。

ChatGPTは画像を生成できますか?

はい。最新の画像ジェネレーターモデルであるDALL-E 3は画像を作成することができ、現在ChatGPT Plus加入者は月額20ドルで利用可能です。DALL-E 3では、チャットボットに4つの異なる画像バリエーションを生成させることができます。