From f8ca003942f2d94bd3b4c3e1aed9b463a47c18aa Mon Sep 17 00:00:00 2001 From: estromenko Date: Sun, 2 Nov 2025 22:02:04 +0300 Subject: [PATCH] Improve clickhouse query for vacancies --- .../collect_vacancies_from_telegram_messages.py | 17 ++++++++++------- 1 file changed, 10 insertions(+), 7 deletions(-) diff --git a/vacancies/main/management/commands/collect_vacancies_from_telegram_messages.py b/vacancies/main/management/commands/collect_vacancies_from_telegram_messages.py index c25ab00..d22d7ce 100644 --- a/vacancies/main/management/commands/collect_vacancies_from_telegram_messages.py +++ b/vacancies/main/management/commands/collect_vacancies_from_telegram_messages.py @@ -11,13 +11,16 @@ FROM telegram_parser_chatmessage WHERE timestamp >= now() - INTERVAL 30 DAY AND length(message) > 150 AND arrayCount(x -> position(message, x) > 0, [ - 'вакансия', 'ищем', 'требуется', 'разработчик', 'будет плюсом', - 'зарплата', 'оклад', 'з/п', 'руб', 'опыт работы', - 'требования', 'обязанности', 'условия', 'компания', 'офис', - 'удаленно', 'гибкий график', 'полный день', 'частичная занятость', - 'резюме', 'собеседование', 'junior', 'middle', 'senior' - ]) >= 5 AND position(message, 'О себе') = 0 AND position(message, 'Обо мне') = 0 - AND position(message, '#ищу') = 0 AND position(message, 'умею') = 0 + 'ваканси', 'ищем', 'требуется', 'разработчик', 'будет плюсом', + 'зарплат', 'оклад', 'з/п', 'руб', 'опыт', + 'требовани', 'обязанности', 'условия', 'офис', + 'удаленн', 'гибкий график', 'полный день', 'занятост', + 'резюме', 'собеседовани', 'junior', 'middle', 'senior', 'ждем', 'компани', + 'заниматься', 'формат', 'занятость', 'вилка', 'должност', 'контакт' + ]) >= 5 + AND arrayCount(x -> position(lower(message), x) > 0, [ + 'о себе', 'обо мне', 'умею', '#ищу' + ]) = 0 AND id NOT IN %(exist_points)s """