AI Systems AIStackToolsProductionClaude Code

実際にproductionで使っているAI stack

Client workと自分のproductsで実際に動いているAI toolsの全体像。何が残り、何を切り、どんなoperating logicでstackを組んでいるか。

Wojciech Łuszczyński

GTM Architect & Growth Operator · Insights · 2026年5月22日

TL;DR · Key insights

Stackはreasoning、execution、research、CRM/dataの4層。各層には明確な役割があります。
残したものと同じくらい、切ったものが重要です。Zapier、Notion AI、いくつかのenrichment toolsはproduction workに耐えませんでした。
AI toolの判断基準は一つ。より良いoutputを作るのか、それとも仕事を別の場所へ移すだけなのか。

この記事には、私が書かないバージョンがあります。47個のtools、比較表、10点満点のスコア。もう読んだことがあるはずです。そしてあまり役に立たなかったはずです。

ここでは別の書き方をします。今のproduction stackで実際に動いているAI tools、それぞれの役割、なぜ残っているのか。そして何を切ったのか。実務では、この「切ったもの」のほうが学びになります。

前提として、私はtoolsを二つに分けています。より良いoutputを作るtoolsと、仕事をただ別の場所へ移すtoolsです。前者は残ります。後者は時間を使わせ、何か進んでいる感覚だけを残します。

Stack by layer

Layer 1: Reasoning

Claude Sonnet / Opusは、複雑なdiagnostic workに使います。ICP analysis、GTM architecture review、positioning synthesis。複数のconstraintsを同時に扱い、説明可能な結論が必要なタスクです。

すべてにClaudeを使うわけではありません。Routine drafting、simple rewrite、単純なresearch queryにはfull reasoning layerは不要です。Subject lineの書き換えにOpusを使うのは、額縁を掛けるためにトルクレンチを使うようなものです。

判断基準は、それなしで同じ答えに到達できるか。できるなら使いません。Trade-off、conflicting signals、散らばったinputsから一貫したargumentを作る必要があるなら、この層を使います。

Layer 2: Execution

Claude Codeはagent stackを動かします。Research pipelines、enrichment loops、audit dataからのcontent drafts、CRM classification。ここが一番leverageの大きいtoolです。最も賢いからではなく、intelligence layerを実際のwork productにつなげるからです。

重要なのは設定です。ClientごとのCLAUDE.md、data access用のMCP tools、named sub-tasks用のSkills。Outbound stackとclient engagementsでの使い方は別記事で説明しています。短く言えば、良いoperator contextを持ったClaude Codeは、以前ならteamが必要だった仕事を作ります。

Cursorはrepoに残るcodeを書くときに使います。MCP server、Cloudflare Worker、product feature。Claude Codeはthinkingとagent work、CursorはIDE integrationとdiff reviewです。

これは重複ではありません。Claude Codeはoperator。Cursorはeditorです。

Layer 3: Research

Exa MCPはagent runs内のreal-time web research用です。LLM利用に向いたsemantic search、clean responses、crawler blockingの少なさがあります。Company researchではBrave Searchより安定していました。

Browser automation MCPはPlaywrightベースで、通常のscrapingを止めるページに使います。LinkedIn company pages、一部のSaaS pricing pages、Glassdoor signals。Bulk crawlingではなく、重要度の高い数ページに使います。

Perplexityは、industry、market、technical topicの背景理解に使います。Sourceではなくresearch brief generatorとして扱います。重要な内容は必ず確認します。

Layer 4: CRM and data

HubSpot MCPはCRM operations用です。Contact/company recordsの読み取り、ICP criteriaによるclassification、data quality issueの検出、update payloadの生成。MCPが入ると、classification logicが一貫し、auditしやすくなります。

GA4 / AmplitudeはAI toolsではなくdata sourcesです。ReportsやAPIからstructured dataを取り、reasoning layerに渡します。「直近90日のacquisition by channelとconversion by cohortから診断して」という問いは、dataがcleanならreasoning layerが得意です。

切ったもの

ZapierはMCP serversに置き換えました。Simpleなapp connectionには良いですが、複雑なworkflowはmaintenance problemになりました。MCPはsetupが重い代わりに、inspectable、versionable、robustです。

Notion AIはslotを正当化できませんでした。Outputはgenericで、contextも狭い。私はNotionで書きますが、Claudeで考えます。

Apollo/Clearbit enrichmentは、このuse caseではagent researchに置き換えました。大きなsales teamならcreditsは意味があります。ただ、client workで必要なresearch qualityとpersonalization depthにはagent stackのほうが合っています。

GPT-4 / Geminiはactive useではありません。悪いからではなく、stackがすでにcoherentだからです。明確なjobがないmodelを増やすと、output qualityではなくdecision overheadが増えます。

Operating logic

Stackはtool listではありません。workflowのどこにintelligenceを置くか、そして各layerが何を担当するかの設計です。

Reasoning layer: judgmentを持ち、問題を診断し、logicを決める。
Execution layer: workを実行し、outputを作り、contextを保つ。
Research layer: real-world dataを他のlayersへ入れる。
Data layer: 何が起きたか、何を意味するかを保存する。

Toolは、このどれかをalternativeより良くできるときだけ残ります。Outputが悪い、maintenance costが高い、より良い選択肢がある。そのときは切ります。

Stackは変わります。ここにあるものの一部は半年後に消えています。それで問題ありません。Operating logicは残ります。

GTM function向けのAI stackを作っていて、何を残すべきか見たいなら、相談を予約してください。