Мій особистий гайд по прикладному застосуванню LLM-моделей для економічного аналізу / фінансового моделювання
Григорій Кукуруза, економіст, співзасновник Ukraine Economic Outlook
Богдан Кукуруза, студент Computer Science, Dublin City University
Мій особистий гайд по прикладному застосуванню LLM-моделей для економічного аналізу / фінансового моделювання.
В чому цінність даного тексту?
- Він написаний виключно з власного досвіду і з порад високопрофесійних друзів з фінансового сектору. LLM для програмування та бізнес-задач / економічного аналізу – це зовсім різні світи. Тому стандартні таблиці – результати “прогонки” моделей за різними тестами можуть не відповідати на конкретно Ваші задачі (конкурентний аналіз, швидка оцінка обсягу ринку, швидкий аналіз новин для формування хронології останніх подій з об’єктом).
- Суб’єктивні рекомендації по застосуванню різних моделей для різних задач. Мій робочий стіл – це Claude, ChatGPT, Gemini, Grok, Perplexity. В кожної з моделей свої сильні сторони в роботі з джерелами (формування бази даних для наступного аналізу), “розмірковуванні” та реальній видачі результату, роботі з файлами (побудова “костяку” моделі, перевірка всіх формул та взаємозв’язків в ній), роботі з текстами та інше.
- Спостереження та рекомендації по інтеграції в робочі процеси на практиці. Вихідна позиція – це тотальний дефіцит професійних та інтелектуальних кадрів. Одночасно при мінімальному вільному бюджеті на інновації та підвищення продуктивності персоналу. Тому, оптимальним є рух не в напрямку LLM-автоматизацій процесів, а кастомізованого підвищення продуктивності кожного окремого члена команди. Бізнес в Україні точно не має такого ж фінансового запасу, як підприємці в країнах Скандинавії, DACH чи Бенілюксу, на тех-експерименти. Обережно нагадаю, що 95% таких експериментів завершилось провалами (дослідження MIT, липень 2025), лише 5% інтеграцій дійсно приносять високу віддачу. Реально досяжна ціль – взяти середньокваліфікованого працівника і “прокачати його”, як в кіберпанку. Звісно, довгостроковий ризик – буде ще менше людей, які принаймні розумітимуть, як це зробити руками. І ще більше новин про "консалтинг впіймали на чат-джипітізмі". Друга частина – окремий біль, але його можна уникнути, якщо регламентувати використання LLM-моделей в окремих функціях, без надмірного фанатизму.
Основні приклади застосування LLM-моделей з моєї практики:
- Підготовка інформаційних довідок – хронологій подій (для компаній, інвестиційних проектів, законопроектів);
- Пошук та агрегація великих масивів відкритих даних (наприклад, здійснених інвестицій за галузями та регіонами за останні 5 років).
- Формування консенсус-прогнозів для валютних пар, commodities, окремих економік;
- Швидке тестування гіпотез (бізнес-ідеї, експортні напрямки);
- Аналіз ринків / конкурентний аналіз. Для роботи з українськими запитами “збагачую” вихідну базу також вибірками з реєстрів у BizFinder (автоматичні вибірки компаній за галузями (КВЕД), оборотами та гео-прив’язкою);
- Побудова базових фінансових моделей (баланс, P&L, Cash Flow); верифікація взаємозв’язків, формул в xlsx-файлах, аналіз сезонності;
Етап-1. Пошук даних, робота з джерелами та наповнення банку даних для подальшого аналізу
Зовнішні джерела. Я не ризикую “запитувати” інформацію в LLM-моделях, щоб уникнути ризику “галюцинацій”. Лише парсинг ними даних із зовнішніх джерел.
- ChatGPT – Agent Mode (значно “розумніший” за Web Search).
- Gemini – Deep Research в режимі Pro.
- Grok – DeepSearch в режимі Expert.
- Claude – Opus 4.5 – Web Search + Extended thinking + Research mode.
Пишете свій пошуковий запит, з деталізацією очікуваного результату. На практиці запускаю всі 4 моделі на пошук. Збираю всі результати в Claude і потім вже формую звіт. Зазвичай Agent Mode опрацьовує ~10-15 джерел, але максимально детально вивчає кожне з них. Gemini – Deep Research, залежно від задачі, може опрацювати від ≤ 10 джерел до 120-150. Grok аналогічно: для широкого запиту може опрацювати ~ 60-100 джерел. Перевага Grok – з безкоштовних версій для обробки джерел він однозначно лідер. Claude, залежно від запиту, опрацьовував від 50 до 400 джерел кожен.
Мова запиту. Кожна LLM-модель апріорі намагається мінімізувати витрату своїх ресурсів. Тому якщо ви думали, що модель шукає інформацію одночасно всіма мовами і потім перекладає результат мовою запиту – це не так. Пріоритет в обробці джерел робиться на мові запиту. Потім залежно від контексту можуть додаватись найпоширеніші мови для теми (англійська, німецька, французька, китайська) або контекстний пошук іншими локальними мовами. У кожної з моделей свій, трішки інший підхід пріорітизації мови. Тому цей аспект критично важливо враховувати. Або на запит про короткий репорт про вугільну галузь – ви отримаєте звіт, як правильно інтегрувати шахти так званих ДНР та ЛНР в російську систему енергетики (з власної практики).
Внутрішні джерела. Формально всі інструменти дозволяють підключити доступи до Google Drive. У Claude desktop взагалі широкий арсенал інструментів. Але на практиці доводиться працювати з різних девайсів напряму з “зоопарком” файлів різних форматів. Для “легких” файлів до 5 мб працює все. З 20+ мб у мене справлявся лише Gemini. Grok – страшно б’ється і лагає при завантаженні файлів у принципі.
Робота з аудіо. Офлайн-наради та стратегічні сесії зберігаються в нашому житті. Gemini Pro — єдиний з інструментів дозволяє швидко розшифрувати запис та автоматично складає короткий структурований документ з усією інформацією.
Окремий пункт – робота з реєстрами. ChatGPT, Gemini та Grok мають безлімітні доступи до реєстрів з лімітованим доступом (наприклад, з фінансовою звітністю компаній). Тому за ЄДРПОУ / European Unique Identifier / іншим ідентифікатором юрособи можна легко знайти фінансову звітність компанії.
Етап-2. Обробка та аналіз даних, формування звіту та висновків.
Основне правило – всі LLM-моделі схожі на непоганого, але дуже вузькоспеціалізованого спеціаліста, який у процесі підготовки звіту обов’язково допустить 1-2 критичні помилки, які на першій ітерації вашої спільної роботи дають абсолютно непридатний для застосування результат. Фраза-мем: “Так, дійсно, ти правий. Зараз я перероблю звіт” – це насправді рулетка, в якій або Ви знайдете помилку, або Ваш клієнт.
Тому якщо Ви готові взяти на себе ризик, відповідальність за аналіз помилок у підготовленому звіті, тоді є зміст грати в цю гру. Раніше ~70% (старі часи моделі о3 ChatGPT рік тому) інформації в підготовленому репорті було вірними, наразі ця пропорція зросла до ~90-95%. Питання – чи вистачить Вашої компетенції виявити 5% помилок серед всього масиву.
Просто нагадаю, виник новий термін – workslop – контент, згенерований штучним інтелектом, який на перший погляд виглядає готовим до використання, але насправді потребує значного доопрацювання.
З важливих плюсів: рівень роботи кращих LLM-моделей у напрямку “розмірковування” вже вище junior-аналітика.
Предметно по моделям. Для мене однозначний лідер – Claude Opus 4.5 (Web Search + Extended thinking + Research mode). Реліз моделі був лише наприкінці листопада.
Модель дійсно якісно формує звіт, має чітке, структуроване мислення. Сама рекомендує форму відповіді (word-формат, xlsx). Сильні сторони: бізнес-аналіз, робота з фінансовою звітністю, економічний аналіз.
Короткий огляд функціоналу, всього на 6 хвилин, але змістовний:
Друге місце — у GPT 5.2 Thinking (+ режим Deep research). Реліз був лише 11 грудня. В цілому, має право на життя. Але виключно як другий номер. Основний мінус – це нестабільність результату. Ситуативно модель може сформувати цілком пристойний звіт (з покроковим мисленням, саморефлексією, унікальними висновками). Деколи — жаль витраченого часу на очікування (може бути до 10-15 хвилин “розмірковування та підготовки”).
Третє місце можна розділити між Gemini 3.0 Pro та Grok Expert. Gemini однозначно лідер по обробці документів, їх систематизації, формуванні коротких простих висновків. Але не більше. Однозначний фаворит Gemini – опція Deep Research, але в усіх інших задачах я захоплення колег не розділяю. Індекси / заміри якості високі, а кінцевий результат низький. Grok Expert, враховуючи, що в мене взагалі не було ніяких позитивних очікувань, дуже навіть непогано. Низький рівень Hallucination Rate (найнижчий після Claude). З мінусів — може “залагати” і загубити весь написаний Вами промт-запит після години очікування (неприємно, але траплялось).
Perplexity Лабораторія / Perplexity Глибоке дослідження – теж має право на життя. Однозначно сильний у роботі з файлами (створення екселей, презентацій), але дуже схожий на клон Claude.
Для об’єктивності додаю огляд проведених замірів ефективності різних моделей (хоч він і не співпадає з моїми спостереженнями):
Коротке нагадування: завжди слідкуйте за перемикачем моделей – задача LLM мінімізувати кількість витраченого на вас ресурсу. Тому краще не обирати опцію “Auto” при виборі режиму роботи, лише найрозумніший (але і найповільніший) з режимів.
Етап-3. Робота з файлами (xlsx), аналіз взаємозв’язків та прописаних формул, базове фінансове моделювання.
Основний функціонал (використання одразу в Excel). Якщо коротко, до практичного масового використання продукт ще не готовий. Але в рамках обережного тестування цілком прийнятно.
На цьому раунді з нами залишаються лише Claude та ChatGPT, вбудовані у лінійку Microsoft 365 Frontier (основний інтерес – Excel). Це тестовий доступ до агентів Copilot (побудованих на конкуруючих LLM, з опцією внутрішнього вибору).
Плюси: відкритий код, який дозволяє слідкувати за логікою LLM-моделі. Дійсно швидка та зручна робота з великими Excel-файлами (що значно важче при роботі безпосередньо у вікні LLM), функціонал аналізу даних, вбудови та перевірки формул. Наявний “професійний бекграунд” у Claude для роботи з фінансовими моделями.
Короткий огляд побудови фінансової моделі, прогнозування доходу, зарплатного фонду, візуалізації через дашборд.
Так, middle-аналітик Big Four та Big Three зроблять краще. Але за скільки часу, чи не краще спростити роботу і почати її вже на підготовленому шаблоні, та основне запитання – а що робити компаніям, в яких немає персоналу цього рівня кваліфікації? Тому, насправді, багато що Агентам в Excel можна пробачити.
Обмежений функціонал (робота з файлами через стандартне вікно користувача). Можна працювати з Claude та Perplexity (можу помилятись стосовно ChatGPT, але такий сформований досвід за останні місяці; ChatGPT об’єктивно сильно відстає саме при роботі з xlsx файлами, а щоб він проаналізував всі наявні формули всередині, склав опис що, чому і як і перевірив на можливі помилки – позитивного досвіду не було).
Claude та Perplexity (Режим Лабораторії) цілком пристойно аналізують xlsx-файли на декілька сторінок, перевіряють логіку побудови моделі, взаємозв’язки між формулами. Враховуючи часту практику поведінки клієнтів “дуже терміново треба — потім вже не треба, а потім знову прямо дуже терміново треба, прямо опівночі”, - це ідеальний інструмент освіжити розуміння файлу / онборінгу в проект.
Етап-4. Інтеграція та внутрішній спротив персоналу.
Перш за все, потрібно сказати велике дякую всім інфобізнесменам, які в 2023-2024 роках сформували неадекватно завищені очікування до технології. На Заході — для нарощування капіталізації, в нас — щоб продати курси / інтеграції / майстер-класи. Тепер завдяки ним у пристойному товаристві теми LLM-автоматизації не обговорюються. Але мусимо виходити з наявних реалій і необхідності підвищувати продуктивність персоналу любою ціною.
- Фінанси. Визначте працівників, на яких лежить значне інтелектуальне навантаження, та надайте їм щомісячний бюджет хоча б $150-250 на LLM-підписки. Досвід та оцінка можливостей їх прикладного використання набуваються в процесі тестів та експериментів. За декілька місяців працівники повернуться з ідеями / пропозиціями, що та як можна імплементувати на постійній основі. Тоді є зміст переходити на корпоративні підписки.
- Той самий ветеран праці, який «все може зробити краще AI». Такий є в кожному колективі. Тому в компанії має бути CDTO (або хтось, на кого покладена дана функція в умовах режиму високої економії), у якого повноваження «третьої» особи після CEO та CFO.
- Швидкі результати та реальність цілей. Не потрібно бігти швидше ведмедя, а лише швидше того другого хлопця. Walmart оптимізувала логістику через внутрішнє AI-рішення Route Optimization та продає його як SaaS-продукт. Ймовірність, що Ви побудуєте таке ж внутрішнє рішення, яке потім можна буде навіть продати ринку, мінімальна (хоча можливо все). Сконцентруйтесь на підвищенні продуктивності окремих працівників. Це менш амбітний підхід, але реальніший.
- Доцільність зовнішньої експертизи. На короткій дистанції значно вигідніше залучити зовнішню команду для аналізу наявних процесів і підготовки пропозицій щодо інтеграції LLM, ніж робити ставку на внутрішній найм. Реальних “старожилів” — професіоналів із глибоким практичним досвідом — насправді дуже мало. Як проєкт вони ще можуть взятися, а от найм зазвичай можливий лише за оверпрайс. Натомість “ентузіасти AI-автоматизації” з піврічним досвідом швидше нароблять шкоди, ніж дадуть результат. Якщо в команді немає професійних розробників із досвідом щонайменше 5 років, це як мінімум підозріло.