機密性の高いアプリケーションのためのエッジAI/オンプレミスAIモデル

多くの組織が、AIを製品や社内プロセスに統合したいと考えているが、データのプライバシーを犠牲にすることはない。そのような組織にとっての解決策は、データをクラウドに送るのではなく、自社のサーバーにAIモデルをダウンロードして展開することだ。この記事では、このオンプレミス戦略(「エッジAI」とも呼ばれる)について説明する。

On-Premise AI

オンプレミス/エッジ・コンピューティングとは何か?

オンプレミスまたはエッジ・コンピューティングとは、集中型のクラウドインフラにデータを送るのではなく、そのソースに近い場所でデータを処理・保存することを指す。このアプローチでは、コンピューティング・リソースはデータを送信するシステムの近くに配置される。

言い換えれば、オンプレミスやエッジコンピューティングは、アプリケーションがSaaS APIのような外部のクラウドサービスを利用するのではなく、自社のサーバーにデプロイされるという事実を表す流行の表現だ。

オンプレミスとして考えられるシナリオは2つある:自社の設備にホスティングされた自社のマシンを持つか、AWS、GCP、Azureなどのクラウドベンダーを活用するか...。厳密には後者の方が、基盤となるサーバーをコントロールできないため「オンプレミス」ではないが、一般的にはどちらも有効なオンプレミス/エッジソリューションとみなすことができる。

なぜオンプレミスAI/エッジAIが重要なのか?

オンプレミスまたはエッジコンピューティングには、いくつかの利点があります。まず、オンプレミスまたはエッジ・コンピューティングは、機密情報をソースに近い場所に保管し、クラウドへの移動中に不正アクセスやデータ侵害が発生するリスクを低減し、クラウド事業者が不要な目的でデータを活用するのを防ぐことで、データのプライバシーとセキュリティを劇的に強化します。また、ローカルでの保存と処理を必要とするデータ規制や法律への準拠にも役立ちます。

さらに、データがクラウドに到達するまでに長距離を移動する必要がないため、待ち時間が短縮され、より迅速な処理とリアルタイムの分析が可能になる。さらに、ネットワーク接続への依存を最小限に抑えることができるため、インターネットが信頼できなかったり中断されたりした場合でも、業務を継続することができる。

AIは非常に優れたオンプレミス候補だ。

第一の理由は、組織が極めて機密性の高いデータをAIモデルに送る傾向があることだ。これは特に、医療アプリケーション、金融アプリケーション、...のような重要な分野で当てはまりますが、それだけではありません。

2つ目の理由は、現在市場に出回っているAIアクターは、顧客のデータを自社のビジネスに再利用する傾向があるということだ。例えば、組織がChatGPTにデータを送信すると、データは精査され、OpenAIは自社のAIモデルを訓練するためにデータを再利用することができる。ChatGPTとGPT-4のプライバシーに関する懸念は、多くの組織をオンプレミス戦略に集中させる中心的な問題である。

AIモデルをオンプレミス/エッジに展開するには?

AIモデルをオンプレミスで展開するには、AIモデルをホスト、管理、提供するためのインフラを、クラウドではなく、組織内のデータセンターまたはマネージド・インフラストラクチャ内に設定する必要がある。

以下は、オンプレミスでのAIモデルの展開に関わる一般的な手順である:

オンプレミスのAIモデルをNLPクラウドのような専用ベンダーに頼ることで、これらの手順を簡略化することができる。例えば、NLPクラウドに関する限り、推論用に最適化された、すぐに使えるAIモデルを含むDockerイメージにアクセスできる。

オンプレミス/エッジコンピューティングVSクラウドコンピューティング:長所と短所

オンプレミスまたはエッジコンピューティングには限界がある。エッジで利用可能なコンピューティングリソースは、一般的にクラウドインフラに比べて限られているため、展開できるアプリケーションの複雑さが制限される可能性があります。さらに、複数の拠点に分散したコンピューティング・リソースを維持・管理することは困難であり、ITインフラや専門知識への追加投資が必要となります。

一般的に、このような戦略は、OpenAI、Anthropic、NLP Cloud...のようなマネージドSaaSに頼るよりもコストがかかる。

最後に、データのプライバシーは、基盤となるオンプレミスのインフラが正しく保護されている場合にのみ保証される。

結論

オンプレミスAI/エッジAIは、AIが組織の間で徐々に浸透しつつある現在、急増している。

このような傾向は理解できる:AIは、強いプライバシー要件があるあらゆる種類の重要なアプリケーションで使用されており、設計上、標準的なクラウド・アクターはこれらの要件を満たすことができない。

もし、あなたのAIプロジェクトでこのような戦略にご興味があれば、ぜひご連絡ください: [email protected]

Maxime
NLPクラウド 戦略的パートナーシップ担当