Skip to content

SamPetux/JobesFromTGParser

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

JobesFromTGParser

# Telegram Channel Parser

Парсер сообщений из Telegram каналов с сохранением в CSV файл.

## Установка

1. Клонируйте репозиторий:
   ```bash
   git clone https://github.com/ваш-username/telegram-parser.git
   cd telegram-parser
  1. Установите зависимости:

    pip install -r requirements.txt
  2. Настройте конфигурацию в файле config.py:

    • API_ID и API_HASH - получите на my.telegram.org
    • PHONE - ваш номер телефона в Telegram
    • GROUP_IDENTIFIER - username или ID канала
    • START_FROM_ID - ID сообщения для начала парсинга (0 для автоматического определения)

Использование

1. Парсинг всего канала (с последнего сохраненного сообщения)

  1. Убедитесь, что START_FROM_ID = 0 в config.py

  2. Запустите парсер:

    python main.py
  3. Парсер будет:

    • Автоматически находить последнее сохраненное сообщение
    • Продолжать парсинг новых сообщений
    • Перезапускаться каждые 60 секунд

2. Парсинг с определенного ID сообщения

  1. Установите нужный ID в config.py:

    START_FROM_ID = 123456  # ID сообщения, с которого начать
  2. Запустите парсер:

    python main.py
  3. Парсер:

    • Начнет с указанного ID
    • Будет парсить все сообщения после него
    • Сохранит результаты в CSV

Структура CSV файла

Файл telegram_messages.csv будет содержать:

  • ID - идентификатор сообщения
  • Год - год публикации
  • Месяц - месяц публикации (1-12)
  • Текст - текст сообщения

Рекомендации

  1. Для длительных сессий используйте screen или tmux
  2. При ошибках проверьте:
    • Правильность API данных
    • Доступ к каналу
    • Интернет-соединение
  3. Для больших каналов увеличьте CHUNK_SIZE до 200

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages