
NEW 2025.04.28
プログラミング不要でAIアプリを構築『Dify』の実力と可能性
ChatGPTをはじめとする生成AIの普及により、企業の業務効率化やサービス開発において生成AIの活用が急速に進んでいます。しかし、生成AIを活用したアプリケーションの開発には、環境構築やプログラミングスキルなど、多くの技術的障壁が存在していました。そんな中、登場したのが「Dify」です。
Difyは「先進的なAIアプリケーションのためのイノベーションエンジン」を謳う、生成AI特化型の開発プラットフォームです。プログラミング不要で生成AIアプリケーションを構築できることから、エンジニアだけでなくUXデザイナーやプロダクトマネージャーなど、様々な職種の方々に注目されています。
今回は、このDifyを実際に使用して生成AIアプリを開発した体験をもとに、機能や特徴、UXデザインプロセスでの活用可能性について紹介します。
1.Difyの主な機能
Difyは、以下のようなAIアプリケーション開発を効率化するための様々な機能を提供しています。
①ノーコードでの生成AIアプリ構築
Difyの最大の特徴は、コードを書かずに生成AIアプリケーションを開発できる点です。
様々な機能を持ったブロックを繋げていくだけで、アプリ開発を行うことが可能です。

これらのブロックを繋げることで、例えば「ユーザーの質問内容によって回答を変える」(条件分岐)、「天気予報APIと連携して最新の天気情報を返す」(API連携)、「社内マニュアルの内容をAIが参照して回答する」(RAG)など、様々な機能を実装することが可能です。
②RAG(検索拡張生成)機能
LLMは基本的に学習済みのデータをもとに回答を行うため、データに含まれない最新の情報や企業の未公開情報などの回答を行うことはできません。例えば、社内ツールの使用方法について回答するチャットボットを生成AIベースで作りたいと思っても、ChatGPTでは答えられません。
こういった自社の社内情報や、外部の最新情報をLLMにインプットし回答させる技術のことを「RAG(Retrieval-Augmented Generation:検索拡張生成)」といいます。
一見難しそうに見える技術ですが、DifyはPDFやcsv、notionなどのコンテンツをアップロードすることで、RAGを簡単に導入することができます。

③APIとしての公開オプション
作成したアプリケーションは、Webアプリとして公開するだけでなく、APIとして他のシステムから利用することも可能です。これにより、既存のWebサイトやアプリケーションに生成AI機能を組み込むことができます。
以上がDifyの概要と機能です。ここからは、私たちが実際に使ってみた一例をご紹介します。
2.実際にDifyでアプリを開発してみた
【テンプレートの活用】
今回はDifyの機能を体験するため、公式に提供しているテンプレートの一つである「NotebookLM by Dify.AI」というアプリケーションを使用してみました。「NotebookLM by Dify.AI」を選んだ理由は、まずは既成のテンプレートを使うことでDifyの基本操作を効率よく学べること、またテンプレートの説明文からポッドキャストを生成するという複雑な処理フローが含まれており、Difyの機能性を幅広く体験できると考えたためです。
名前の通りですが、「NotebookLM by Dify.AI」はNotebookLMにある機能をDify上で再現するためのアプリケーションになります。
NotebookLMはGoogleが提供するサービスであり、ユーザーがアップロードしたドキュメントを生成AIにより分析し、情報整理することに強みを持つサービスになります。

NotebookLMの機能にAudio Overviewというものがあります。これはユーザーがアップロードしたファイルの内容について、1クリックで対話形式での音声として生成できる機能になります。
テンプレートはDifyのアプリ管理画面から簡単に作成することが可能なので、試してみましょう。

本来はすべて英語で設定されていましたが、今回は説明のしやすさから全て翻訳したものを使用したいと思います。
設定された各ブロックを確認すると、処理のフローは以下のようになっているようです
1.開始ブロック
a.ユーザーからのインプット待ち状態で、以下の情報を必須項目としている。
b.ポットキャストのテーマとなるファイル、会話のトーン、ポッドキャストで話し合う2人の名前、話す言語。
2.ファイル解析(テキスト抽出ブロック)
a.ユーザーからアップロードされたファイルを、AIが理解できるようにテキストを抽出する。
3.ファイルの分析・アイデア検討(LLMブロック)
a.ファイル解析で得られたデータから、LLMで内容を分析し、ポッドキャストのアイデアを考える。
4.台本作成(LLMブロック)
a.考えたアイデア、ユーザーの指定したトーン、名前、言語を元にポッドキャストの台本を作成する。
5.台本出力(回答ブロック)
a.生成した台本をユーザーが確認できるようにテキスト形式で出力する。
6.締めくくり(LLMブロック)
a.生成した台本をもとに、ポッドキャストの締めくくりを作成する。
7.締めくくり出力(回答ブロック)
a.生成した締めくくりをユーザーが確認できるようにテキスト形式で出力する。
8.変数入力(テンプレート)
a.生成した台本・締めくくりを音声化するために1つのテキストにまとめる。
9.待機中(回答ブロック)
a.音声生成に時間がかかるので、そのステータスをユーザーが確認できるように出力する
10.音声生成(Podcast Audio Generatorブロック)
a.生成した台本をOpenAIのAPIを使用して、音声に変換する
11.音声出力(回答ブロック)
a.生成した音声をユーザーが確認できるように出力する。
【アプリの公開・使用】
実際にこのアプリを使用してみましょう。右上にある「プレビュー」ボタンから、実際の挙動を確かめることができます。
試しに、EXPERIENCE+で公開されているGlileoAIの紹介記事のHTMLデータをダウンロードして、そのデータをもとにポッドキャストを作ってみました。
カジュアルなトーン、日本語でタカさんとジュンさんに話し合ってもらう設定ですが、問題なく台本が生成されました。

音声の生成には時間がかかってしまうようで、数分待ちましたがwav形式で出力されました。実際聞いてみると、発音に少し違和感はありますが問題なく聞くことができるクオリティでポッドキャストを生成することできました。
※注意点
実際にテンプレートを動かすにあたって、そのままでは動かすことができなかったので、以下の調整を行いました。
・LLMの設定:テンプレートではClaudeを使用していましたが、OpenAIのAPIしか持ち合わせていなかったので、LLMをchatgpt-4o-latestに変更しました。
・Podcast Audio Generatorブロックの設定:このブロックでTTS可能なAPIとの連携が必要だったため、OpenAIのAPIを設定しました。
・台本の文字数:原因がDify側なのかAPI側なのか、文字数が多いと音声生成の処理が終わらない現象がありました。台本生成のLLMの設定で出力できるMax Tokensの設定を100まで押さえて設定しました。
3.Difyを使用して感じたメリット
Difyを実際に使用してみて感じたメリットを紹介します。
①アイデアから実装までのサイクル短縮
最も大きなメリットは、アイデアの検証サイクルの大幅な短縮です。従来であれば、アイデアからプロトタイプ作成、検証までに数週間かかったり、アイデア検討段階ではパワーポイントやFigmaなどの静的なモックアップでの検討に留まり、実際のAI応答の品質や自然さは実装後の検証になりがちでしたが、Difyを使えば数時間で機能するプロトタイプを作成できます。
これにより、より多くの仮説を素早く検証し、ユーザーの実際のフィードバックに基づいて製品を改善していくことが可能になります。特に生成AI機能を持つサービスでは、AIの応答パターンや想定外の回答のリスク検証が難しく、これまで「完全に機能を実装した後でないとテストできない」という大きな壁がありました。Difyによって、プログラミングなしでも生成AI機能を動作させて検証できるため、「設計→実装→検証」という長いサイクルの開発から、「小さく作って→すぐに検証→素早く改善する」という、生成AIサービス開発に特化したアジャイルなプロセスが実現可能になったのです。
②ディレクター・プランナーの自走力向上
Difyはプログラミングスキルを持たないディレクターやプランナーでも、前述のようにビジュアルで直感的な「ブロックをつなげる」インターフェースを採用しており、複雑なコードを書く必要なく操作しやすいツールです。ドラッグ&ドロップの簡単な操作だけで生成AIの機能が実装できるため、非エンジニアでも自分の考えたユーザー体験を具現化できます。これにより、エンジニアのリソース確保を待つことなく、自分のアイデアを形にして検証できるようになります。
4.クリエイティブでの活用例
実際に使ってみて、Difyはクリエイティブプロセスの様々な段階で活用できる可能性を感じました。以下に、クリエイティブな観点からの活用例をいくつか紹介します。
①プロトタイピングツールとしての活用
プランニング・プロトタイピング段階では、ユーザー体験の検証が重要ですが、生成AIはハレーションリスクなど机上では想定しきれない挙動があります。
本来このフェーズでの生成AI開発はコストが大きく難しいものでしたが、Difyを活用することで、この問題を解決できます。たとえば、ある金融サービスのチャットアシスタント機能を検討しているケースを考えてみましょう。
Difyを使えば、以下のような金融サービスのチャットアシスタント機能のプロトタイプも短時間で作成し検証できます
例:
・ 「若年層向け」 「高齢者向け」 「投資経験者向け」など、異なるユーザー層に合わせた話し方のパターンを複数作り、どの応対スタイルが最も好まれるかを比較検証できる。
・ 「投資信託とは何ですか?」→「初心者向けのおすすめ投資信託は?」→「リスクはどのくらい?」といった連続した質問のやり取りを実際に動くアプリで検証し、自然な会話の流れを確認できる。
・ AIが回答できない専門的な質問を受けた場合に「申し訳ありません、その質問については担当者におつなぎします」など、適切な対応方法へ誘導するシナリオもテストできる。
これらのプロトタイプは、実際に動作するため、ペーパープロトタイプやモックアップと比較して、ユーザーテストからより現実的なフィードバックを得ることができます。
②サービスへの実活用
セキュリティ、運用保守等の検討は必要になりますが、実際にプロトタイピングで作成したDifyアプリケーションをそのまま実際のサービスとしても活用可能です。
DifyはAPIも提供しており、外部サービスから自分の作成したDifyアプリケーションで生成した内容を受け取ることが可能です。
③業務効率化ツールとしての活用
リサーチデータやインタビュー録音の文字起こしデータをRAGでインプットし、LLMに分析の補助をさせることで、リサーチャーは数十時間かかっていた分析作業を数時間に短縮でき、より多くの時間を深い洞察の発見に割り当てられるようになります。
また、デザイナーが様々なパターンで画像生成し検証したい場合にも、毎回画像生成サービスにプロンプトを打たず、Difyで効率よく生成させ続けることが可能です。
ーおわりに
プログラミングスキルを持たない人でも生成AIアプリケーションを構築できるツールとして、クリエイティブ業界に新しい可能性をもたらしていると感じました。
Difyのようなノーコードプラットフォームの登場は、「誰がAIアプリケーションを作れるか」という境界を大きく広げるものです。
本記事が、生成AIツールへの理解を深め、使いこなすきっかけになれば幸いです。
参考URL
・Experience+ 記事「瞬時にUIを生成するAIツール「Galileo AI(ガリレオAI)」を実際に触ってみた」
https://xp-plus.jp/reports/article_41/
・Dify HP
・NotebookLM

藏本 航
エクスペリエンス&プロダクト部門
筑波大学人間総合科学研究科を修了後、ITスタートアップにてPMとして従事。自社プロダクトのLP・Webアプリ開発に携わる。2023年に電通デジタルへ転職。現在、クリエイティブテクノロジストとしてXR・生成AIをはじめとした先端技術を活用した、プロダクトの新規開発を担当。
※所属は記事公開当時のものです。
RELATED REPORT