Как спарсить чаты и каналы в телеграм и собрать качественную базу

Мы рекомендуем использовать парсинг чатов, так как именно там можно собрать наибольшее количество профилей с BIO участников. Чаты дают доступ к живой аудитории, которая активно общается и оставляет больше данных о себе.

Однако, при желании вы можете применять аналогичную механику и к комментариям в каналах. В этом случае процесс практически не отличается: берёте ссылку на канал с активной секцией комментариев и парсите участников по тем же шагам.

1. Поиск чатов через бота

Для поиска чатов можно использовать бесплатного бота @searchforchatsbot.

  1. В боте выберите «Искать группы».
  2. Отправьте список ключевых слов, связанных с вашей тематикой.

Например, если вы ищете предпринимателей:

  • Владельцы бизнеса
  • Чат предпринимателей
  • Бизнес

2. Поиск чатов через Deep Reserch в Chat GPT

В Сhat GPT вы можете заказать глубокое исследование с запросом найти список чатов из нужной вам тематики c помощью промпта.

Пример такого промпта:

Найди активные Telegram-чаты, где общаются предприниматели и владельцы бизнесов.

Формат ответа: список ссылок на чаты в телеграм.

Условия:
Нужны именно чаты (не каналы), где предприниматели реально обсуждают бизнес.
Темы чатов:
  • малый и средний бизнес
  • франшизы
  • стартапы и инвестиции
  • офлайн-бизнес (кафе, магазины, услуги)
  • онлайн-бизнес (e-commerce, IT, digital)
  • клубы и комьюнити предпринимателей

Для каждого чата укажи:

  • название
  • короткое описание (чем полезен)
  • ссылку

Подбери 10–15 чатов.
В конце сделай отдельные подборки:
  • для владельцев офлайн-бизнеса
  • для онлайн-предпринимателей (e-commerce, IT)

3. Парсинг чатов

После того когда вы собрали чаты, вам необходимо спарсить всех, кто пишет в них сообщения с описанием (БИО) их профилей. БИО потребуется для того, чтобы потом можно было отфильтровать эту аудиторию по ключевым словам.

Для парсинга чатов мы рекомендуем использовать бота https://t.me/SendRock_ToolsBot

Далее описан функционал бота, который доступен по подписке.

Алгоритм:

  1. Отправьте список чатов или каналов
  2. Соберите тех, кто писал в них сообщения или комментарии к постам
Рекомендуем собирать от 50 000 сообщений за раз, чтобы собрать достаточное количество пользователей

Так вы получите максимальную базу активных участников с их описаниями профилей.

4. Фильтр базы по ключевым словам в описании профилей

Чтобы собрать целевую аудиторию, отфильтруйте базу по ключевым словам в описании профилей.

Подготовка:

  • Составьте список ключевых слов через «|» (например: владелец | CEO | founder | основатель).
  • Сделайте список стоп-слов, которые исключают нерелевантные профили (например: курсы | марафон | онлайн-школа).
Ипользуйте этот шаблон в Google Sheets:

  1. На листе Profiles вставьте в колонку A — логины, в колонку B — БИО.
  2. На листе Filter в ячейке А1 используйте формулу, заранее заполнив в ней ключевые слова:

=FILTER(PROFILES!A2:B,
REGEXMATCH(TO_TEXT(PROFILES!B2:B), "(владелец | CEO | founder |основатель)")
*
NOT(REGEXMATCH(TO_TEXT(PROFILES!B2:B), "(курсы | марафон | онлайн-школа)"))
)