Skip to content

Parser general information on the cian.ru website

Notifications You must be signed in to change notification settings

sham-sr/cianparser

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

38 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Сбор данных с сайта объявлений об аренде и продаже недвижимости Циан

Cianparser - это библиотека Python 3 для парсинга сайта Циан. С его помощью можно получить достаточно подробные и структурированные данные по краткосрочной и долгосрочной аренде, продаже квартир, домов, танхаусов итд.

Установка

pip install cianparser

Использование

>>> import cianparser
    
>>> data = cianparser.parse(offer="rent_long", accommodation="flat", location="Казань", rooms="all", start_page=1, end_page=2)

>>> print(data[0])
               Start collecting information from pages..
Setting [=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>] 100%
1 page: [=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>] 100%
2 page: [=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>=>] 100%

{'accommodation': 'flat',
 'all_floors': 29,
 'author': 'ID 579515',
 'comm_meters': 51,
 'commissions': 0,
 'district': 'Vahitovskij',
 'floor': 11,
 'how_many_rooms': 2,
 'kitchen_meters': 18,
 'link': 'https://kazan.cian.ru/rent/flat/260751194/',
 'price_per_month': 25000,
 'square_meters': 51,
 'street': ' Scherbakovskij pereulok',
 'year_of_construction': 2014}

Конфигурация

Функция parse имеет следующий аргументы:

  • offer - тип объявления, к примеру, долгосрочная, краткосрочная аренда, продажа ("rent_long", "rent_short", "sale")
  • accommodation - вид жилья, к примеру, квартира, комната, дом, часть дома, таунхаус ("flat", "room", "house", "house-part", "townhouse")
  • location - локация объявления, к примеру, Казань (для просмотра доступных мест используйте cianparser.list_cities())
  • rooms - количество комнат, к примеру, 1, (1,3, "studio"), "studio, "all"; по умолчанию любое ("all")
  • start_page - страница, с которого начинается сбор данных, по умолчанию, 1
  • end_page - страница, с которого заканчивается сбор данных, по умолчанию, 100

В настоящее время функция parse принимает offer и accommodation только с значениями "rent_long" и "flat", соответственно

Признаки, получаемые в ходе сбора данных с предложений по долгосрочной аренде.

  • Link - ссылка на это объявление
  • District - район, в которой расположена квартира
  • Price_per_month - стоимость аренды в месяц
  • Commissions - коммиссиия, взымаемая в ходе первичной аренды
  • kitchen_meters - количество квадратных метров кухни
  • How_many_rooms - количество комнат, от 1 до 4х
  • Floor - этаж, на котором расположена квартира
  • Square_meters - общее количество квадратных метров
  • Street - улица, в которой расположена квартира
  • Author - автор объявления
  • All_floors - общее количество этажей в здании, на котором расположена квартира
  • Year_of_construction - год постройки здания, на котором расположена квартира

В некоторых объявлениях отсутсвуют данные по некоторым признакам (год постройки, жилые кв метры, кв метры кухни). В этом случае проставляется значение -1.

Пример исследования получаемых данных

В данном проекте можно увидеть некоторые результаты анализа полученных данных на примере сведений об объявленияъ по аренде недвижимости в городе Казань:

https://github.com/lenarsaitov/cian-data-analysis

About

Parser general information on the cian.ru website

Resources

Stars

Watchers

Forks

Packages

No packages published

Languages

  • Python 100.0%