# Регулярный запуск парсера

## Вариант 1: systemd-таймер (рекомендуется)

```bash
# Замени YOUR_USER на твоё имя пользователя на VPS
sudo cp systemd/scraper-dou@.service /etc/systemd/system/
sudo cp systemd/scraper-dou@.timer   /etc/systemd/system/
sudo systemctl daemon-reload
sudo systemctl enable --now scraper-dou@YOUR_USER.timer

# Проверка
systemctl status scraper-dou@YOUR_USER.timer
systemctl list-timers | grep scraper
journalctl -u scraper-dou@YOUR_USER.service -f
```

## Вариант 2: cron

```bash
crontab -e
```

Добавь:

```
# DOU каждый час
0 * * * * cd /home/YOUR_USER/self_healing_scraper && ./venv/bin/python main.py dou --category Python --limit 100 >> data/cron.log 2>&1

# Work.ua два раза в день (LLM-вызовы дорогие, не часто)
0 9,21 * * * cd /home/YOUR_USER/self_healing_scraper && ./venv/bin/python main.py workua --query python --pages 2 >> data/cron.log 2>&1

# Ротация Tor каждые 6 часов (если хочешь свежий IP для обхода блокировок)
0 */6 * * * sudo systemctl restart tor
```

## Просмотр результатов

```bash
# Все вакансии
sqlite3 data/jobs.db "SELECT source, title, company, salary_raw FROM jobs ORDER BY parsed_at DESC LIMIT 20;"

# Только новые за последний час
sqlite3 data/jobs.db "SELECT title, company FROM jobs WHERE first_seen > datetime('now', '-1 hour');"

# Сколько вакансий по источникам
sqlite3 data/jobs.db "SELECT source, COUNT(*) FROM jobs GROUP BY source;"
```
