Хайды в разделе базы для брута
ru:
На данном форуме не работает система просмотров хайда после ответа в теме! Для того, что бы увидеть скрытый контент, вы должны развиватся на форуме (зарабатывать реакции) или приобрести премиум статус - Повышение

En:
Hyde's view system does not work on this forum after the answer in the topic! In order to see the hidden content, you must be active on the forum (earn reactions) or purchase a premium status - Upgrade
  • Добро пожаловать на сайт - Forumteam.bet !

    Что бы просматривать темы форума необходимо зарегестрироваться или войти в свой аккаунт.

    Группа в телеграме (подпишитесь, что бы не потерять нас) - ForumTeam Chat [Подписатся]
    Связь с администратором - @ftmadmin

Многопоточный instagram-парсер по ключевому слову (Python)

  • Автор темы Redman
  • Дата начала
  • Ответы 0
  • Просмотры 1K

Redman

<FORUMTEAM>
Команда форума
Регистрация
13.11.17
Многопоточный instagram-парсер по ключевому слову (Python)

История такая: нужно было собрать базу пользователей instagram, максимально хорошего качества для массовой подписки и лайкинга.

Вопрос: как это сделать? Варианты:

1. На платных сервисах спарсить
2. Подумать головой и написать небольшой скрипт.
Выбираем вариант 2. Суть: берем любую прогу для массовой подписки (например бесплатный Леонграм), собираем ВСЕХ ПУБЛИЧНЫХ подписчиков ваших непосредственных конкурентов (приватных не надо), конвертируем их в логины .

Запускаем данный скрипт:



Перетаскиваем тхт с базой в окно скрипта и жмем Enter:



Пишем, какое слово парсеру нужно искать в профилях базы, например Москва и жмем Enter:



Скрипт создает рядом с вашей базой файлик названиебазы2.тхт и записывает туда найденные логины. Скрипт многопоточный, на данный момент 30 потоков, скорость обработки- около 100 000 аккаунтов в час.
Из плюсов:
- Многопоточность (скорость)
- Обращения скрипта идут не на сервер Instagram, ваш IP не забанят в инсте из за частых запросов!
- Легкость и минимум потребления ресурсов
- Не требует авторизации в Instagram
Из минусов:
- Главный и единственный минус в том, что скрипт работает только с базами в формате логины. К сожалению, придется конвертировать из ID в логины и обратно (возможно запилю с работой по базам ID).

Еще раз, что делает скрипт: заходит на каждый профиль инстаграм из вашей базы, ищет ключевое слово, которое вы написали в описании аккаунта, логине или ссылке- если находит, записывает его в тхт. Все.

А теперь пример, как собрать хорошую базу для городского паблика, например для Москвы:
1. Парсим всех публичных подписчиков московских пабликов и конвертируем базу в логины
2. Закидываем полученную базу в формате логины в скрипт
3. Указываем, что ищем слово vk.com
4. Ждем окончания парсинга, конвертируем обратно в ID.
5. При массовой подписке указываем, что не подписываемся на бизнес аккаунты и на аккаунты, у которых больше 1000 подписок и 1000 подписчиков. Выходит очень крутая база! Объясняю почему vk.com: обычно живые пользователи Инстаграма указывают ссылку на свой контакт. Их то мы и собираем, и отсеиваем магазины уже при подписке.
В принципе можно искать что угодно, на что у вас хватит фантазии

;Скачать;

;vt;
 
Сверху Снизу