Skip to content

dima23113/Python-for-Data-Science

Β 
Β 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

Β 

History

23 Commits
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 

Repository files navigation

Python for Data Science
Education

Python для Data Science

Π£Ρ‡Π΅Π±Π½Ρ‹Π΅ задания Π½Π° ΠΏΠΎΡ€Ρ‚Π°Π»Π΅ GeekBrains.

Lesson 02. Pandas. NumPy

ΠŸΡ€Π°ΠΊΡ‚ΠΈΡ‡Π΅ΡΠΊΠΎΠ΅ Π·Π°Π΄Π°Π½ΠΈΠ΅ NumPy

Π—Π°Π΄Π°Π½ΠΈΠ΅ 1

  1. Π˜ΠΌΠΏΠΎΡ€Ρ‚ΠΈΡ€ΡƒΠΉΡ‚Π΅ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΡƒ Numpy ΠΈ Π΄Π°ΠΉΡ‚Π΅ Π΅ΠΉ псСвдоним np. Π‘ΠΎΠ·Π΄Π°Ρ‚ΡŒ ΠΎΠ΄Π½ΠΎΠΌΠ΅Ρ€Π½Ρ‹ΠΉ массив Numpy ΠΏΠΎΠ΄ Π½Π°Π·Π²Π°Π½ΠΈΠ΅ΠΌ a ΠΈΠ· 12 ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… Ρ†Π΅Π»Ρ‹Ρ… чисСл чисСл ΠΎΡ‚ 12 Π΄ΠΎ 24 Π½Π΅Π²ΠΊΠ»ΡŽΡ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π‘ΠΎΠ·Π΄Π°Ρ‚ΡŒ 5 Π΄Π²ΡƒΠΌΠ΅Ρ€Π½Ρ‹Ρ… массивов Ρ€Π°Π·Π½ΠΎΠΉ Ρ„ΠΎΡ€ΠΌΡ‹ ΠΈΠ· массива a. НС ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π² Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚Π°Ρ… ΠΌΠ΅Ρ‚ΠΎΠ΄Π° reshape число -1. Π‘ΠΎΠ·Π΄Π°Ρ‚ΡŒ 5 Π΄Π²ΡƒΠΌΠ΅Ρ€Π½Ρ‹Ρ… массивов Ρ€Π°Π·Π½ΠΎΠΉ Ρ„ΠΎΡ€ΠΌΡ‹ ΠΈΠ· массива a. Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π² Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚Π°Ρ… ΠΌΠ΅Ρ‚ΠΎΠ΄Π° reshape число -1 (Π² Ρ‚Ρ€Π΅Ρ… ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π°Ρ… - для обозначСния числа столбцов, Π² Π΄Π²ΡƒΡ… - для строк). МоТно Π»ΠΈ массив Numpy, состоящий ΠΈΠ· ΠΎΠ΄Π½ΠΎΠ³ΠΎ столбца ΠΈ 12 строк, Π½Π°Π·Π²Π°Ρ‚ΡŒ ΠΎΠ΄Π½ΠΎΠΌΠ΅Ρ€Π½Ρ‹ΠΌ?
  2. Π‘ΠΎΠ·Π΄Π°Ρ‚ΡŒ массив ΠΈΠ· 3 строк ΠΈ 4 столбцов, состоящий ΠΈΠ· случайных чисСл с ΠΏΠ»Π°Π²Π°ΡŽΡ‰Π΅ΠΉ запятой ΠΈΠ· Π½ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ распрСдСлСния со срСдним, Ρ€Π°Π²Π½Ρ‹ΠΌ 0 ΠΈ срСднСквадратичным ΠΎΡ‚ΠΊΠ»ΠΎΠ½Π΅Π½ΠΈΠ΅ΠΌ, Ρ€Π°Π²Π½Ρ‹ΠΌ 1.0. ΠŸΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ ΠΈΠ· этого массива ΠΎΠ΄Π½ΠΎΠΌΠ΅Ρ€Π½Ρ‹ΠΉ массив с Ρ‚Π°ΠΊΠΈΠΌ ΠΆΠ΅ Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚ΠΎΠΌ size, ΠΊΠ°ΠΊ ΠΈ исходный массив.
  3. Π‘ΠΎΠ·Π΄Π°Ρ‚ΡŒ массив a, состоящий ΠΈΠ· Ρ†Π΅Π»Ρ‹Ρ… чисСл, ΡƒΠ±Ρ‹Π²Π°ΡŽΡ‰ΠΈΡ… ΠΎΡ‚ 20 Π΄ΠΎ 0 Π½Π΅Π²ΠΊΠ»ΡŽΡ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ с ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»ΠΎΠΌ 2. Π‘ΠΎΠ·Π΄Π°Ρ‚ΡŒ массив b, состоящий ΠΈΠ· 1 строки ΠΈ 10 столбцов: Ρ†Π΅Π»Ρ‹Ρ… чисСл, ΡƒΠ±Ρ‹Π²Π°ΡŽΡ‰ΠΈΡ… ΠΎΡ‚ 20 Π΄ΠΎ 1 Π½Π΅Π²ΠΊΠ»ΡŽΡ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ с ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»ΠΎΠΌ 2. Π’ Ρ‡Π΅ΠΌ Ρ€Π°Π·Π½ΠΈΡ†Π° ΠΌΠ΅ΠΆΠ΄Ρƒ массивами a ΠΈ b?
  4. Π’Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½ΠΎ ΡΠΎΠ΅Π΄ΠΈΠ½ΠΈΡ‚ΡŒ массивы a ΠΈ b. a - Π΄Π²ΡƒΠΌΠ΅Ρ€Π½Ρ‹ΠΉ массив ΠΈΠ· Π½ΡƒΠ»Π΅ΠΉ, число строк ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ большС 1 ΠΈ Π½Π° 1 мСньшС, Ρ‡Π΅ΠΌ число строк Π΄Π²ΡƒΠΌΠ΅Ρ€Π½ΠΎΠ³ΠΎ массива b, состоящСго ΠΈΠ· Π΅Π΄ΠΈΠ½ΠΈΡ†. Π˜Ρ‚ΠΎΠ³ΠΎΠ²Ρ‹ΠΉ массив v Π΄ΠΎΠ»ΠΆΠ΅Π½ ΠΈΠΌΠ΅Ρ‚ΡŒ Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚ size, Ρ€Π°Π²Π½Ρ‹ΠΉ 10.
  5. Π‘ΠΎΠ·Π΄Π°Ρ‚ΡŒ ΠΎΠ΄Π½ΠΎΠΌΠ΅Ρ€Π½Ρ‹ΠΉ массив Π°, состоящий ΠΈΠ· ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Ρ†Π΅Π»Ρ‹Ρ… чисСл ΠΎΡ‚ 0 Π΄ΠΎ 12. ΠŸΠΎΠΌΠ΅Π½ΡΡ‚ΡŒ Ρ„ΠΎΡ€ΠΌΡƒ этого массива, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ»Π°ΡΡŒ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π° A (Π΄Π²ΡƒΠΌΠ΅Ρ€Π½Ρ‹ΠΉ массив Numpy), состоящая ΠΈΠ· 4 строк ΠΈ 3 столбцов. ΠŸΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρƒ At ΠΏΡƒΡ‚Π΅ΠΌ транспонирования ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ A. ΠŸΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρƒ B, ΡƒΠΌΠ½ΠΎΠΆΠΈΠ² ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρƒ A Π½Π° ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρƒ At с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΌΠ°Ρ‚Ρ€ΠΈΡ‡Π½ΠΎΠ³ΠΎ умноТСния. Какой Ρ€Π°Π·ΠΌΠ΅Ρ€ ΠΈΠΌΠ΅Π΅Ρ‚ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π° B? ΠŸΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡΡ Π»ΠΈ Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚ΡŒ ΠΎΠ±Ρ€Π°Ρ‚Π½ΡƒΡŽ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρƒ для ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ B ΠΈ ΠΏΠΎΡ‡Π΅ΠΌΡƒ?
  6. Π˜Π½ΠΈΡ†ΠΈΠ°Π»ΠΈΠ·ΠΈΡ€ΡƒΠΉΡ‚Π΅ Π³Π΅Π½Π΅Ρ€Π°Ρ‚ΠΎΡ€ случайных числС с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° seed, Ρ€Π°Π²Π½ΠΎΠ³ΠΎ 42. Π‘ΠΎΠ·Π΄Π°ΠΉΡ‚Π΅ ΠΎΠ΄Π½ΠΎΠΌΠ΅Ρ€Π½Ρ‹ΠΉ массив c, составлСнный ΠΈΠ· ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ 16-Ρ‚ΠΈ случайных Ρ€Π°Π²Π½ΠΎΠΌΠ΅Ρ€Π½ΠΎ распрСдСлСнных Ρ†Π΅Π»Ρ‹Ρ… чисСл ΠΎΡ‚ 0 Π΄ΠΎ 16 Π½Π΅Π²ΠΊΠ»ΡŽΡ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ. ΠŸΠΎΠΌΠ΅Π½ΡΠΉΡ‚Π΅ Π΅Π³ΠΎ Ρ„ΠΎΡ€ΠΌΡƒ Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ»Π°ΡΡŒ квадратная ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π° C. ΠŸΠΎΠ»ΡƒΡ‡ΠΈΡ‚Π΅ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρƒ D, поэлСмСнтно ΠΏΡ€ΠΈΠ±Π°Π²ΠΈΠ² ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρƒ B ΠΈΠ· ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰Π΅Π³ΠΎ вопроса ΠΊ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π΅ C, ΡƒΠΌΠ½ΠΎΠΆΠ΅Π½Π½ΠΎΠΉ Π½Π° 10. ВычислитС ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚Π΅Π»ΡŒ, Ρ€Π°Π½Π³ ΠΈ ΠΎΠ±Ρ€Π°Ρ‚Π½ΡƒΡŽ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρƒ D_inv для D.
  7. ΠŸΡ€ΠΈΡ€Π°Π²Π½ΡΠΉΡ‚Π΅ ΠΊ Π½ΡƒΠ»ΡŽ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ числа Π² ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π΅ D_inv, Π° ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ - ΠΊ Π΅Π΄ΠΈΠ½ΠΈΡ†Π΅. Π£Π±Π΅Π΄ΠΈΡ‚Π΅ΡΡŒ, Ρ‡Ρ‚ΠΎ Π² ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π΅ D_inv ΠΎΡΡ‚Π°Π»ΠΈΡΡŒ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π½ΡƒΠ»ΠΈ ΠΈ Π΅Π΄ΠΈΠ½ΠΈΡ†Ρ‹. Π‘ ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ numpy.where, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρƒ D_inv Π² качСствС маски, Π° ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ B ΠΈ C - Π² качСствС источников Π΄Π°Π½Π½Ρ‹Ρ…, ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚Π΅ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρƒ E Ρ€Π°Π·ΠΌΠ΅Ρ€ΠΎΠΌ 4x4. Π­Π»Π΅ΠΌΠ΅Π½Ρ‚Ρ‹ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ E, для ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠΉ элСмСнт ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ D_inv Ρ€Π°Π²Π΅Π½ 1, Π΄ΠΎΠ»ΠΆΠ½Ρ‹ Π±Ρ‹Ρ‚ΡŒ Ρ€Π°Π²Π½Ρ‹ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰Π΅ΠΌΡƒ элСмСнту ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ B, Π° элСмСнты ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ E, для ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠΉ элСмСнт ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ D_inv Ρ€Π°Π²Π΅Π½ 0, Π΄ΠΎΠ»ΠΆΠ½Ρ‹ Π±Ρ‹Ρ‚ΡŒ Ρ€Π°Π²Π½Ρ‹ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰Π΅ΠΌΡƒ элСмСнту ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ C.

Π—Π°Π΄Π°Π½ΠΈΠ΅ 2

Π‘ΠΎΠ·Π΄Π°ΠΉΡ‚Π΅ массив Numpy ΠΏΠΎΠ΄ Π½Π°Π·Π²Π°Π½ΠΈΠ΅ΠΌ a Ρ€Π°Π·ΠΌΠ΅Ρ€ΠΎΠΌ 5x2, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ состоящий ΠΈΠ· 5 строк ΠΈ 2 столбцов. ΠŸΠ΅Ρ€Π²Ρ‹ΠΉ столбСц Π΄ΠΎΠ»ΠΆΠ΅Π½ ΡΠΎΠ΄Π΅Ρ€ΠΆΠ°Ρ‚ΡŒ числа 1, 2, 3, 3, 1, Π° Π²Ρ‚ΠΎΡ€ΠΎΠΉ - числа 6, 8, 11, 10, 7. Π‘ΡƒΠ΄Π΅ΠΌ ΡΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ столбСц - это ΠΏΡ€ΠΈΠ·Π½Π°ΠΊ, Π° строка - наблюдСниС. Π—Π°Ρ‚Π΅ΠΌ Π½Π°ΠΉΠ΄ΠΈΡ‚Π΅ срСднСС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ΠΏΠΎ ΠΊΠ°ΠΆΠ΄ΠΎΠΌΡƒ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΡƒ, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ ΠΌΠ΅Ρ‚ΠΎΠ΄ mean массива Numpy. Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ Π·Π°ΠΏΠΈΡˆΠΈΡ‚Π΅ Π² массив mean_a, Π² Π½Π΅ΠΌ Π΄ΠΎΠ»ΠΆΠ½ΠΎ Π±Ρ‹Ρ‚ΡŒ 2 элСмСнта.

Π—Π°Π΄Π°Π½ΠΈΠ΅ 3

ВычислитС массив a_centered, отняв ΠΎΡ‚ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ массива Π° срСдниС значСния ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΡ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², содСрТащиСся Π² массивС mean_a. ВычислСниС Π΄ΠΎΠ»ΠΆΠ½ΠΎ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚ΡŒΡΡ Π² ΠΎΠ΄Π½ΠΎ дСйствиС. ΠŸΠΎΠ»ΡƒΡ‡ΠΈΠ²ΡˆΠΈΠΉΡΡ массив Π΄ΠΎΠ»ΠΆΠ΅Π½ ΠΈΠΌΠ΅Ρ‚ΡŒ Ρ€Π°Π·ΠΌΠ΅Ρ€ 5x2.

Π—Π°Π΄Π°Π½ΠΈΠ΅ 4

НайдитС скалярноС ΠΏΡ€ΠΎΠΈΠ·Π²Π΅Π΄Π΅Π½ΠΈΠ΅ столбцов массива a_centered. Π’ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ Π΄ΠΎΠ»ΠΆΠ½Π° ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒΡΡ Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Π° a_centered_sp. Π—Π°Ρ‚Π΅ΠΌ ΠΏΠΎΠ΄Π΅Π»ΠΈΡ‚Π΅ a_centered_sp Π½Π° N-1, Π³Π΄Π΅ N - число наблюдСний.

Π—Π°Π΄Π°Π½ΠΈΠ΅ 5**

Число, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ ΠΌΡ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ»ΠΈ Π² ΠΊΠΎΠ½Ρ†Π΅ задания 3 являСтся ΠΊΠΎΠ²Π°Ρ€ΠΈΠ°Ρ†ΠΈΠ΅ΠΉ Π΄Π²ΡƒΡ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², содСрТащихся Π² массивС Π°. Π’ Π·Π°Π΄Π°Π½ΠΈΠΈ 4 ΠΌΡ‹ Π΄Π΅Π»ΠΈΠ»ΠΈ сумму ΠΏΡ€ΠΎΠΈΠ·Π²Π΅Π΄Π΅Π½ΠΈΠΉ Ρ†Π΅Π½Ρ‚Ρ€ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹Ρ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² Π½Π° N-1, Π° Π½Π΅ Π½Π° N, поэтому получСнная Π½Π°ΠΌΠΈ Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Π° являСтся нСсмСщСнной ΠΎΡ†Π΅Π½ΠΊΠΎΠΉ ΠΊΠΎΠ²Π°Ρ€ΠΈΠ°Ρ†ΠΈΠΈ. Π’ этом Π·Π°Π΄Π°Π½ΠΈΠΈ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΡŒΡ‚Π΅ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ²ΡˆΠ΅Π΅ΡΡ число, вычислив ΠΊΠΎΠ²Π°Ρ€ΠΈΠ°Ρ†ΠΈΡŽ Π΅Ρ‰Π΅ ΠΎΠ΄Π½ΠΈΠΌ способом - с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ np.cov. Π’ качСствС Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚Π° m функция np.cov Π΄ΠΎΠ»ΠΆΠ½Π° ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Ρ‚ΡŒ транспонированный массив a. Π’ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ²ΡˆΠ΅ΠΉΡΡ ΠΊΠΎΠ²Π°Ρ€ΠΈΠ°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΉ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π΅ (массив Numpy Ρ€Π°Π·ΠΌΠ΅Ρ€ΠΎΠΌ 2x2) искомоС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ΠΊΠΎΠ²Π°Ρ€ΠΈΠ°Ρ†ΠΈΠΈ Π±ΡƒΠ΄Π΅Ρ‚ Ρ€Π°Π²Π½ΠΎ элСмСнту Π² строкС с индСксом 0 ΠΈ столбцС с индСксом 1.

ΠŸΠΎΠ΄Ρ€ΠΎΠ±Π½Π΅Π΅ ΡƒΠ·Π½Π°Ρ‚ΡŒ ΠΎ ΠΊΠΎΠ²Π°Ρ€ΠΈΠ°Ρ†ΠΈΠΈ ΠΌΠΎΠΆΠ½ΠΎ здСсь: Бсылка

ΠŸΡ€Π°ΠΊΡ‚ΠΈΡ‡Π΅ΡΠΊΠΎΠ΅ Π·Π°Π΄Π°Π½ΠΈΠ΅ Ρ‚Π΅ΠΌΠ° NumPy

Π—Π°Π΄Π°Π½ΠΈΠ΅ 1

A. Π˜ΠΌΠΏΠΎΡ€Ρ‚ΠΈΡ€ΡƒΠΉΡ‚Π΅ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΡƒ Pandas ΠΈ Π΄Π°ΠΉΡ‚Π΅ Π΅ΠΉ псСвдоним pd.
B. Π‘ΠΎΠ·Π΄Π°ΠΉΡ‚Π΅ Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌ authors со столбцами author_id ΠΈ author_name, Π² ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… соотвСтствСнно содСрТатся Π΄Π°Π½Π½Ρ‹Π΅: [1, 2, 3] ΠΈ ['Π’ΡƒΡ€Π³Π΅Π½Π΅Π²', 'Π§Π΅Ρ…ΠΎΠ²', 'ΠžΡΡ‚Ρ€ΠΎΠ²ΡΠΊΠΈΠΉ'].
C. Π—Π°Ρ‚Π΅ΠΌ создайтС Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌ book cΠΎ столбцами author_id, book_title ΠΈ price,Π² ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… соотвСтствСнно содСрТатся Π΄Π°Π½Π½Ρ‹Π΅: [1, 1, 1, 2, 2, 3, 3], ['ΠžΡ‚Ρ†Ρ‹ ΠΈ Π΄Π΅Ρ‚ΠΈ', 'Π ΡƒΠ΄ΠΈΠ½', 'ДворянскоС Π³Π½Π΅Π·Π΄ΠΎ', 'Волстый ΠΈ Ρ‚ΠΎΠ½ΠΊΠΈΠΉ', 'Π”Π°ΠΌΠ° с собачкой', 'Π“Ρ€ΠΎΠ·Π°', 'Π’Π°Π»Π°Π½Ρ‚Ρ‹ ΠΈ ΠΏΠΎΠΊΠ»ΠΎΠ½Π½ΠΈΠΊΠΈ'], [450, 300, 350, 500, 450, 370, 290].

Π—Π°Π΄Π°Π½ΠΈΠ΅ 2

ΠŸΠΎΠ»ΡƒΡ‡ΠΈΡ‚Π΅ Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌ authors_price, соСдинив Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌΡ‹ authors ΠΈ books ΠΏΠΎ полю author_id.

Π—Π°Π΄Π°Π½ΠΈΠ΅ 3

Π‘ΠΎΠ·Π΄Π°ΠΉΡ‚Π΅ Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌ top5, Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ содСрТатся строки ΠΈΠ· authors_price с ΠΏΡΡ‚ΡŒΡŽ самыми Π΄ΠΎΡ€ΠΎΠ³ΠΈΠΌΠΈ ΠΊΠ½ΠΈΠ³Π°ΠΌΠΈ.

Π—Π°Π΄Π°Π½ΠΈΠ΅ 4

A. Π‘ΠΎΠ·Π΄Π°ΠΉΡ‚Π΅ Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌ authors_stat Π½Π° основС ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΈΠ· authors_price.
B. Π’ Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌΠ΅ authors_stat Π΄ΠΎΠ»ΠΆΠ½Ρ‹ Π±Ρ‹Ρ‚ΡŒ Ρ‡Π΅Ρ‚Ρ‹Ρ€Π΅ столбца: author_name, min_price, max_price ΠΈ mean_price, Π² ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π΄ΠΎΠ»ΠΆΠ½Ρ‹ ΡΠΎΠ΄Π΅Ρ€ΠΆΠ°Ρ‚ΡŒΡΡ соотвСтствСнно имя Π°Π²Ρ‚ΠΎΡ€Π°, минимальная, максимальная ΠΈ срСдняя Ρ†Π΅Π½Π° Π½Π° ΠΊΠ½ΠΈΠ³ΠΈ этого Π°Π²Ρ‚ΠΎΡ€Π°.

Π—Π°Π΄Π°Π½ΠΈΠ΅ 5

Π‘ΠΎΠ·Π΄Π°ΠΉΡ‚Π΅ Π½ΠΎΠ²Ρ‹ΠΉ столбСц Π² Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌΠ΅ authors_price ΠΏΠΎΠ΄ Π½Π°Π·Π²Π°Π½ΠΈΠ΅ΠΌ cover, Π² Π½Π΅ΠΌ Π±ΡƒΠ΄ΡƒΡ‚ Ρ€Π°ΡΠΏΠΎΠ»Π°Π³Π°Ρ‚ΡŒΡΡ Π΄Π°Π½Π½Ρ‹Π΅ ΠΎ Ρ‚ΠΎΠΌ, какая ΠΎΠ±Π»ΠΎΠΆΠΊΠ° Ρƒ Π΄Π°Π½Π½ΠΎΠΉ ΠΊΠ½ΠΈΠ³ΠΈ - твСрдая ΠΈΠ»ΠΈ мягкая. Π’ этот столбСц помСститС Π΄Π°Π½Π½Ρ‹Π΅ ΠΈΠ· ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅Π³ΠΎ списка: ['твСрдая', 'мягкая', 'мягкая', 'твСрдая', 'твСрдая', 'мягкая', 'мягкая']. ΠŸΡ€ΠΎΡΠΌΠΎΡ‚Ρ€ΠΈΡ‚Π΅ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°Ρ†ΠΈΡŽ ΠΏΠΎ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ pd.pivot_table с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Π²ΠΎΠΏΡ€ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ Π·Π½Π°ΠΊΠ°. Для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Π°Π²Ρ‚ΠΎΡ€Π° посчитайтС ΡΡƒΠΌΠΌΠ°Ρ€Π½ΡƒΡŽ ΡΡ‚ΠΎΠΈΠΌΠΎΡΡ‚ΡŒ ΠΊΠ½ΠΈΠ³ Π² Ρ‚Π²Π΅Ρ€Π΄ΠΎΠΉ ΠΈ мягкой ΠΎΠ±Π»ΠΎΠΆΠΊΠ΅.Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠΉΡ‚Π΅ для этого Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ pd.pivot_table. ΠŸΡ€ΠΈ этом столбцы Π΄ΠΎΠ»ΠΆΠ½Ρ‹ Π½Π°Π·Ρ‹Π²Π°Ρ‚ΡŒΡΡ "твСрдая" ΠΈ "мягкая",Π° индСксами Π΄ΠΎΠ»ΠΆΠ½Ρ‹ Π±Ρ‹Ρ‚ΡŒ Ρ„Π°ΠΌΠΈΠ»ΠΈΠΈ Π°Π²Ρ‚ΠΎΡ€ΠΎΠ². ΠŸΡ€ΠΎΠΏΡƒΡ‰Π΅Π½Π½Ρ‹Π΅ значСния стоимостСй Π·Π°ΠΏΠΎΠ»Π½ΠΈΡ‚Π΅ нулями,ΠΏΡ€ΠΈ нСобходимости Π·Π°Π³Ρ€ΡƒΠ·ΠΈΡ‚Π΅ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΡƒ Numpy. НазовитС ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹ΠΉ датасСт book_info ΠΈ сохранитС Π΅Π³ΠΎ Π² Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ pickle ΠΏΠΎΠ΄ Π½Π°Π·Π²Π°Π½ΠΈΠ΅ΠΌ "book_info.pkl".Π—Π°Ρ‚Π΅ΠΌ Π·Π°Π³Ρ€ΡƒΠ·ΠΈΡ‚Π΅ ΠΈΠ· этого Ρ„Π°ΠΉΠ»Π° Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌ ΠΈ Π½Π°Π·ΠΎΠ²ΠΈΡ‚Π΅ Π΅Π³ΠΎ book_info2.Π£Π΄ΠΎΡΡ‚ΠΎΠ²Π΅Ρ€ΡŒΡ‚Π΅ΡΡŒ, Ρ‡Ρ‚ΠΎ Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌΡ‹ book_info ΠΈ book_info2 ΠΈΠ΄Π΅Π½Ρ‚ΠΈΡ‡Π½Ρ‹

Lesson 04. Визуализация Π΄Π°Π½Π½Ρ‹Ρ… Π² Matplotlib.

Π—Π°Π΄Π°Π½ΠΈΠ΅ 1

Π—Π°Π³Ρ€ΡƒΠ·ΠΈΡ‚Π΅ ΠΌΠΎΠ΄ΡƒΠ»ΡŒ pyplot Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΈ matplotlib с псСвдонимом plt, Π° Ρ‚Π°ΠΊΠΆΠ΅ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΡƒ numpy с псСвдонимом np.
ΠŸΡ€ΠΈΠΌΠ΅Π½ΠΈΡ‚Π΅ ΠΌΠ°Π³ΠΈΡ‡Π΅ΡΠΊΡƒΡŽ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ %matplotlib inline для отобраТСния Π³Ρ€Π°Ρ„ΠΈΠΊΠΎΠ² Π² Jupyter Notebook ΠΈ настройки ΠΊΠΎΠ½Ρ„ΠΈΠ³ΡƒΡ€Π°Ρ†ΠΈΠΈ Π½ΠΎΡƒΡ‚Π±ΡƒΠΊΠ° со Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ΠΌ 'svg' для Π±ΠΎΠ»Π΅Π΅ Ρ‡Π΅Ρ‚ΠΊΠΎΠ³ΠΎ отобраТСния Π³Ρ€Π°Ρ„ΠΈΠΊΠΎΠ².
Π‘ΠΎΠ·Π΄Π°ΠΉΡ‚Π΅ список ΠΏΠΎΠ΄ Π½Π°Π·Π²Π°Π½ΠΈΠ΅ΠΌ x с числами 1, 2, 3, 4, 5, 6, 7 ΠΈ список y с числами 3.5, 3.8, 4.2, 4.5, 5, 5.5, 7.
Π‘ ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ plot постройтС Π³Ρ€Π°Ρ„ΠΈΠΊ, ΡΠΎΠ΅Π΄ΠΈΠ½ΡΡŽΡ‰ΠΈΠΉ линиями Ρ‚ΠΎΡ‡ΠΊΠΈ с Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΡŒΠ½Ρ‹ΠΌΠΈ ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚Π°ΠΌΠΈ ΠΈΠ· списка x ΠΈ Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½Ρ‹ΠΌΠΈ - ΠΈΠ· списка y.
Π—Π°Ρ‚Π΅ΠΌ Π² ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΉ ячСйкС постройтС Π΄ΠΈΠ°Π³Ρ€Π°ΠΌΠΌΡƒ рассСяния (Π΄Ρ€ΡƒΠ³ΠΈΠ΅ названия - Π΄ΠΈΠ°Π³Ρ€Π°ΠΌΠΌΠ° разброса, scatter plot).

Π—Π°Π΄Π°Π½ΠΈΠ΅ 2

Π‘ ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ linspace ΠΈΠ· Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΈ Numpy создайтС массив t ΠΈΠ· 51 числа ΠΎΡ‚ 0 Π΄ΠΎ 10 Π²ΠΊΠ»ΡŽΡ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ.
Π‘ΠΎΠ·Π΄Π°ΠΉΡ‚Π΅ массив Numpy ΠΏΠΎΠ΄ Π½Π°Π·Π²Π°Π½ΠΈΠ΅ΠΌ f, содСрТащий косинусы элСмСнтов массива t.
ΠŸΠΎΡΡ‚Ρ€ΠΎΠΉΡ‚Π΅ Π»ΠΈΠ½Π΅ΠΉΠ½ΡƒΡŽ Π΄ΠΈΠ°Π³Ρ€Π°ΠΌΠΌΡƒ, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ массив t для ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚ ΠΏΠΎ Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΠΈ, Π° массив f - для ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚ ΠΏΠΎ Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΠΈ. Линия Π³Ρ€Π°Ρ„ΠΈΠΊΠ° Π΄ΠΎΠ»ΠΆΠ½Π° Π±Ρ‹Ρ‚ΡŒ Π·Π΅Π»Π΅Π½ΠΎΠ³ΠΎ Ρ†Π²Π΅Ρ‚Π°.
Π’Ρ‹Π²Π΅Π΄ΠΈΡ‚Π΅ Π½Π°Π·Π²Π°Π½ΠΈΠ΅ Π΄ΠΈΠ°Π³Ρ€Π°ΠΌΠΌΡ‹ - 'Π“Ρ€Π°Ρ„ΠΈΠΊ f(t)'.
Π’Π°ΠΊΠΆΠ΅ Π΄ΠΎΠ±Π°Π²ΡŒΡ‚Π΅ названия для Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΡŒΠ½ΠΎΠΉ оси - 'ЗначСния t' ΠΈ для Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½ΠΎΠΉ - 'ЗначСния f'.
ΠžΠ³Ρ€Π°Π½ΠΈΡ‡ΡŒΡ‚Π΅ Π³Ρ€Π°Ρ„ΠΈΠΊ ΠΏΠΎ оси x значСниями 0.5 ΠΈ 9.5, Π° ΠΏΠΎ оси y - значСниями -2.5 ΠΈ 2.5.

Π—Π°Π΄Π°Π½ΠΈΠ΅ 3

Π‘ ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ linspace Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΈ Numpy создайтС массив x ΠΈΠ· 51 числа ΠΎΡ‚ -3 Π΄ΠΎ 3 Π²ΠΊΠ»ΡŽΡ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ.
Π‘ΠΎΠ·Π΄Π°ΠΉΡ‚Π΅ массивы $y_1$, $y_2$, $y_3$, $y_4$ ΠΏΠΎ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ Ρ„ΠΎΡ€ΠΌΡƒΠ»Π°ΠΌ:
$$y_1 = x^2$$
$$y_2 = 2 * x + 0.5$$
$$y_3 = -3 * x - 1.5$$
$$y_4 = \sin(x)$$
Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ subplots модуля matplotlib.pyplot, создайтС ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ matplotlib.figure.Figure с Π½Π°Π·Π²Π°Π½ΠΈΠ΅ΠΌ fig ΠΈ массив ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² Axes ΠΏΠΎΠ΄ Π½Π°Π·Π²Π°Π½ΠΈΠ΅ΠΌ ax, ΠΏΡ€ΠΈΡ‡Π΅ΠΌ Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Ρƒ вас Π±Ρ‹Π»ΠΎ 4 ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Ρ… Π³Ρ€Π°Ρ„ΠΈΠΊΠ° Π² сСткС, состоящСй ΠΈΠ· Π΄Π²ΡƒΡ… строк ΠΈ Π΄Π²ΡƒΡ… столбцов. Π’ ΠΊΠ°ΠΆΠ΄ΠΎΠΌ Π³Ρ€Π°Ρ„ΠΈΠΊΠ΅ массив x ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚ ΠΏΠΎ Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΠΈ.
Π’ Π»Π΅Π²ΠΎΠΌ Π²Π΅Ρ€Ρ…Π½Π΅ΠΌ Π³Ρ€Π°Ρ„ΠΈΠΊΠ΅ для ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚ ΠΏΠΎ Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠΉΡ‚Π΅ $y_1$, Π² ΠΏΡ€Π°Π²ΠΎΠΌ Π²Π΅Ρ€Ρ…Π½Π΅ΠΌ - $y_2$, Π² Π»Π΅Π²ΠΎΠΌ Π½ΠΈΠΆΠ½Π΅ΠΌ - $y_3$, Π² ΠΏΡ€Π°Π²ΠΎΠΌ Π½ΠΈΠΆΠ½Π΅ΠΌ - $y_4$.
Π”Π°ΠΉΡ‚Π΅ Π½Π°Π·Π²Π°Π½ΠΈΠ΅ Π³Ρ€Π°Ρ„ΠΈΠΊΠ°ΠΌ: 'Π“Ρ€Π°Ρ„ΠΈΠΊ $y_1$', 'Π“Ρ€Π°Ρ„ΠΈΠΊ $y_2$' ΠΈ Ρ‚.Π΄.
Для Π³Ρ€Π°Ρ„ΠΈΠΊΠ° Π² Π»Π΅Π²ΠΎΠΌ Π²Π΅Ρ€Ρ…Π½Π΅ΠΌ ΡƒΠ³Π»Ρƒ установитС Π³Ρ€Π°Π½ΠΈΡ†Ρ‹ ΠΏΠΎ оси x ΠΎΡ‚ -5 Π΄ΠΎ 5.
УстановитС Ρ€Π°Π·ΠΌΠ΅Ρ€Ρ‹ Ρ„ΠΈΠ³ΡƒΡ€Ρ‹ 8 дюймов ΠΏΠΎ Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΠΈ ΠΈ 6 дюймов ΠΏΠΎ Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΠΈ.
Π’Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½Ρ‹Π΅ ΠΈ Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΡŒΠ½Ρ‹Π΅ Π·Π°Π·ΠΎΡ€Ρ‹ ΠΌΠ΅ΠΆΠ΄Ρƒ Π³Ρ€Π°Ρ„ΠΈΠΊΠ°ΠΌΠΈ Π΄ΠΎΠ»ΠΆΠ½Ρ‹ ΡΠΎΡΡ‚Π°Π²Π»ΡΡ‚ΡŒ 0.3.

Π—Π°Π΄Π°Π½ΠΈΠ΅ 4

Π’ этом Π·Π°Π΄Π°Π½ΠΈΠΈ ΠΌΡ‹ Π±ΡƒΠ΄Π΅ΠΌ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ с датасСтом, Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½Ρ‹ Π΄Π°Π½Π½Ρ‹Π΅ ΠΏΠΎ ΠΌΠΎΡˆΠ΅Π½Π½ΠΈΡ‡Π΅ΡΡ‚Π²Ρƒ с ΠΊΡ€Π΅Π΄ΠΈΡ‚Π½Ρ‹ΠΌΠΈ Π΄Π°Π½Π½Ρ‹ΠΌΠΈ: Credit Card Fraud Detection (информация ΠΎΠ± Π°Π²Ρ‚ΠΎΡ€Π°Ρ…: Andrea Dal Pozzolo, Olivier Caelen, Reid A. Johnson and Gianluca Bontempi. Calibrating Probability with Undersampling for Unbalanced Classification. In Symposium on Computational Intelligence and Data Mining (CIDM), IEEE, 2015). Π”Π°Π½Π½Ρ‹ΠΉ датасСт являСтся ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠΌ нСсбалансированных Π΄Π°Π½Π½Ρ‹Ρ…, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ ΠΌΠΎΡˆΠ΅Π½Π½ΠΈΡ‡Π΅ΡΠΊΠΈΠ΅ ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΠΈ с ΠΊΠ°Ρ€Ρ‚Π°ΠΌΠΈ Π²ΡΡ‚Ρ€Π΅Ρ‡Π°ΡŽΡ‚ΡΡ Ρ€Π΅ΠΆΠ΅ ΠΎΠ±Ρ‹Ρ‡Π½Ρ‹Ρ…. Π˜ΠΌΠΏΠΎΡ€Ρ‚Ρ€ΡƒΠΉΡ‚Π΅ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΡƒ Pandas, Π° Ρ‚Π°ΠΊΠΆΠ΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠΉΡ‚Π΅ для Π³Ρ€Π°Ρ„ΠΈΠΊΠΎΠ² ΡΡ‚ΠΈΠ»ΡŒ β€œfivethirtyeight”. ΠŸΠΎΡΡ‡ΠΈΡ‚Π°ΠΉΡ‚Π΅ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° value_counts количСство наблюдСний для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ значСния Ρ†Π΅Π»Π΅Π²ΠΎΠΉ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠΉ Class ΠΈ ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΡ‚Π΅ ΠΊ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹ΠΌ Π΄Π°Π½Π½Ρ‹ΠΌ ΠΌΠ΅Ρ‚ΠΎΠ΄ plot, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ ΡΡ‚ΠΎΠ»Π±Ρ‡Π°Ρ‚ΡƒΡŽ Π΄ΠΈΠ°Π³Ρ€Π°ΠΌΠΌΡƒ. Π—Π°Ρ‚Π΅ΠΌ постройтС Ρ‚Π°ΠΊΡƒΡŽ ΠΆΠ΅ Π΄ΠΈΠ°Π³Ρ€Π°ΠΌΠΌΡƒ, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ логарифмичСский ΠΌΠ°ΡΡˆΡ‚Π°Π±. На ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΌ Π³Ρ€Π°Ρ„ΠΈΠΊΠ΅ постройтС Π΄Π²Π΅ гистограммы ΠΏΠΎ значСниям ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ° V1 - ΠΎΠ΄Π½Ρƒ для ΠΌΠΎΡˆΠ΅Π½Π½ΠΈΡ‡Π΅ΡΠΊΠΈΡ… Ρ‚Ρ€Π°Π½Π·Π°ΠΊΡ†ΠΈΠΉ (Class Ρ€Π°Π²Π΅Π½ 1) ΠΈ Π΄Ρ€ΡƒΠ³ΡƒΡŽ - для ΠΎΠ±Ρ‹Ρ‡Π½Ρ‹Ρ… (Class Ρ€Π°Π²Π΅Π½ 0). ΠŸΠΎΠ΄Π±Π΅Ρ€ΠΈΡ‚Π΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚Π° density Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎ Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΠΈ Π³Ρ€Π°Ρ„ΠΈΠΊΠ° Π±Ρ‹Π»ΠΎ располоТСно Π½Π΅ число наблюдСний, Π° ΠΏΠ»ΠΎΡ‚Π½ΠΎΡΡ‚ΡŒ распрСдСлСния. Число Π±ΠΈΠ½ΠΎΠ² Π΄ΠΎΠ»ΠΆΠ½ΠΎ Ρ€Π°Π²Π½ΡΡ‚ΡŒΡΡ 20 для ΠΎΠ±Π΅ΠΈΡ… гистограмм, Π° коэффициСнт alpha сдСлайтС Ρ€Π°Π²Π½Ρ‹ΠΌ 0.5, Ρ‡Ρ‚ΠΎΠ±Ρ‹ гистограммы Π±Ρ‹Π»ΠΈ ΠΏΠΎΠ»ΡƒΠΏΡ€ΠΎΠ·Ρ€Π°Ρ‡Π½Ρ‹ΠΌΠΈ ΠΈ Π½Π΅ Π·Π°Π³ΠΎΡ€Π°ΠΆΠΈΠ²Π°Π»ΠΈ Π΄Ρ€ΡƒΠ³ Π΄Ρ€ΡƒΠ³Π°. Π‘ΠΎΠ·Π΄Π°ΠΉΡ‚Π΅ Π»Π΅Π³Π΅Π½Π΄Ρƒ с двумя значСниями: β€œClass 0” ΠΈ β€œClass 1”. Гистограмма ΠΎΠ±Ρ‹Ρ‡Π½Ρ‹Ρ… Ρ‚Ρ€Π°Π½Π·Π°ΠΊΡ†ΠΈΠΉ Π΄ΠΎΠ»ΠΆΠ½Π° Π±Ρ‹Ρ‚ΡŒ сСрого Ρ†Π²Π΅Ρ‚Π°, Π° ΠΌΠΎΡˆΠ΅Π½Π½ΠΈΡ‡Π΅ΡΠΊΠΈΡ… - красного. Π“ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΡŒΠ½ΠΎΠΉ оси Π΄Π°ΠΉΡ‚Π΅ Π½Π°Π·Π²Π°Π½ΠΈΠ΅ β€œClass”.

Lesson 06. ΠžΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ с ΡƒΡ‡ΠΈΡ‚Π΅Π»Π΅ΠΌ Π² Scikit-learn

Π—Π°Π΄Π°Π½ΠΈΠ΅ 1

Π˜ΠΌΠΏΠΎΡ€Ρ‚ΠΈΡ€ΡƒΠΉΡ‚Π΅ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΈ pandas ΠΈ numpy.
Π—Π°Π³Ρ€ΡƒΠ·ΠΈΡ‚Π΅ "Boston House Prices dataset" ΠΈΠ· встроСнных Π½Π°Π±ΠΎΡ€ΠΎΠ² Π΄Π°Π½Π½Ρ‹Ρ… Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΈ sklearn. Π‘ΠΎΠ·Π΄Π°ΠΉΡ‚Π΅ Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌΡ‹ X ΠΈ y ΠΈΠ· этих Π΄Π°Π½Π½Ρ‹Ρ….
Π Π°Π·Π±Π΅ΠΉΡ‚Π΅ эти Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌΡ‹ Π½Π° Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹Π΅ (X_train, y_train) ΠΈ тСстовыС (X_test, y_test) с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ train_test_split Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Ρ€Π°Π·ΠΌΠ΅Ρ€ тСстовой Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ составлял 30% ΠΎΡ‚ всСх Π΄Π°Π½Π½Ρ‹Ρ…, ΠΏΡ€ΠΈ этом Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚ random_state Π΄ΠΎΠ»ΠΆΠ΅Π½ Π±Ρ‹Ρ‚ΡŒ Ρ€Π°Π²Π΅Π½ 42.
Π‘ΠΎΠ·Π΄Π°ΠΉΡ‚Π΅ модСль Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ рСгрСссии ΠΏΠΎΠ΄ Π½Π°Π·Π²Π°Π½ΠΈΠ΅ΠΌ lr с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ класса LinearRegression ΠΈΠ· модуля sklearn.linear_model.
ΠžΠ±ΡƒΡ‡ΠΈΡ‚Π΅ модСль Π½Π° Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… (ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠΉΡ‚Π΅ всС ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΈ) ΠΈ сдСлайтС прСдсказаниС Π½Π° тСстовых.
ВычислитС R2 ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Ρ… ΠΏΡ€Π΅Π΄ΠΊΠ°Π·Π°Π½ΠΈΠΉ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ r2_score ΠΈΠ· модуля sklearn.metrics.

Π—Π°Π΄Π°Π½ΠΈΠ΅ 2

Π‘ΠΎΠ·Π΄Π°ΠΉΡ‚Π΅ модСль ΠΏΠΎΠ΄ Π½Π°Π·Π²Π°Π½ΠΈΠ΅ΠΌ model с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ RandomForestRegressor ΠΈΠ· модуля sklearn.ensemble.
Π‘Π΄Π΅Π»Π°ΠΉΡ‚Π΅ Π°Π³Ρ€ΡƒΠΌΠ΅Π½Ρ‚ n_estimators Ρ€Π°Π²Π½Ρ‹ΠΌ 1000, max_depth Π΄ΠΎΠ»ΠΆΠ΅Π½ Π±Ρ‹Ρ‚ΡŒ Ρ€Π°Π²Π΅Π½ 12 ΠΈ random_state сдСлайтС Ρ€Π°Π²Π½Ρ‹ΠΌ 42.
ΠžΠ±ΡƒΡ‡ΠΈΡ‚Π΅ модСль Π½Π° Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… Π°Π½Π°Π»ΠΎΠ³ΠΈΡ‡Π½ΠΎ Ρ‚ΠΎΠΌΡƒ, ΠΊΠ°ΠΊ Π²Ρ‹ ΠΎΠ±ΡƒΡ‡Π°Π»ΠΈ модСль LinearRegression, Π½ΠΎ ΠΏΡ€ΠΈ этом Π² ΠΌΠ΅Ρ‚ΠΎΠ΄ fit вмСсто Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌΠ° y_train ΠΏΠΎΡΡ‚Π°Π²ΡŒΡ‚Π΅ y_train.values[:, 0], Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ ΠΈΠ· Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌΠ° ΠΎΠ΄Π½ΠΎΠΌΠ΅Ρ€Π½Ρ‹ΠΉ массив Numpy, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ для класса RandomForestRegressor Π² Π΄Π°Π½Π½ΠΎΠΌ ΠΌΠ΅Ρ‚ΠΎΠ΄Π΅ для Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚Π° y ΠΏΡ€Π΅Π΄ΠΏΠΎΡ‡Ρ‚ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ массивов вмСсто Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌΠ°.
Π‘Π΄Π΅Π»Π°ΠΉΡ‚Π΅ прСдсказаниС Π½Π° тСстовых Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ посчитайтС R2. Π‘Ρ€Π°Π²Π½ΠΈΡ‚Π΅ с Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠΌ ΠΈΠ· ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰Π΅Π³ΠΎ задания.
ΠΠ°ΠΏΠΈΡˆΠΈΡ‚Π΅ Π² коммСнтариях ΠΊ ΠΊΠΎΠ΄Ρƒ, какая модСль Π² Π΄Π°Π½Π½ΠΎΠΌ случаС Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Π»ΡƒΡ‡ΡˆΠ΅.

* Π—Π°Π΄Π°Π½ΠΈΠ΅ 3

Π’Ρ‹Π·ΠΎΠ²ΠΈΡ‚Π΅ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°Ρ†ΠΈΡŽ для класса RandomForestRegressor, Π½Π°ΠΉΠ΄ΠΈΡ‚Π΅ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ ΠΎΠ± Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚Π΅ feature_importances_.
Π‘ ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ этого Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚Π° Π½Π°ΠΉΠ΄ΠΈΡ‚Π΅ сумму всСх ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»Π΅ΠΉ ваТности, установитС, ΠΊΠ°ΠΊΠΈΠ΅ Π΄Π²Π° ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ° ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‚ Π½Π°ΠΈΠ±ΠΎΠ»ΡŒΡˆΡƒΡŽ Π²Π°ΠΆΠ½ΠΎΡΡ‚ΡŒ.

* Π—Π°Π΄Π°Π½ΠΈΠ΅ 4

Π’ этом Π·Π°Π΄Π°Π½ΠΈΠΈ ΠΌΡ‹ Π±ΡƒΠ΄Π΅ΠΌ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ с датасСтом, с ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌ ΠΌΡ‹ ΡƒΠΆΠ΅ Π·Π½Π°ΠΊΠΎΠΌΡ‹ ΠΏΠΎ Π΄ΠΎΠΌΠ°ΡˆΠ½Π΅ΠΌΡƒ заданию ΠΏΠΎ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ΅ Matplotlib, это датасСт Credit Card Fraud Detection.
Для этого датасСта ΠΌΡ‹ Π±ΡƒΠ΄Π΅ΠΌ Ρ€Π΅ΡˆΠ°Ρ‚ΡŒ Π·Π°Π΄Π°Ρ‡Ρƒ классификации - Π±ΡƒΠ΄Π΅ΠΌ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡ‚ΡŒ, ΠΊΠ°ΠΊΠΈΠ΅ ΠΈΠ· Ρ‚Ρ€Π°Π½Π·Π°ΠΊΡ†ΠΈΡ†ΠΈΠΈ ΠΏΠΎ ΠΊΡ€Π΅Π΄ΠΈΡ‚Π½ΠΎΠΉ ΠΊΠ°Ρ€Ρ‚Π΅ ΡΠ²Π»ΡΡŽΡ‚ΡΡ ΠΌΠΎΡˆΠ΅Π½Π½ΠΈΡ‡Π΅ΡΠΊΠΈΠΌΠΈ.
Π”Π°Π½Π½Ρ‹ΠΉ датасСт сильно нСсбалансирован (Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ случаи ΠΌΠΎΡˆΠ΅Π½Π½ΠΈΡ‡Π΅ΡΡ‚Π²Π° ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Ρ€Π΅Π΄ΠΊΠΈ), Ρ‚Π°ΠΊ Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ accuracy Π½Π΅ принСсСт ΠΏΠΎΠ»ΡŒΠ·Ρ‹ ΠΈ Π½Π΅ ΠΏΠΎΠΌΠΎΠΆΠ΅Ρ‚ Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ Π»ΡƒΡ‡ΡˆΡƒΡŽ модСль.
ΠœΡ‹ Π±ΡƒΠ΄Π΅ΠΌ Π²Ρ‹Ρ‡ΠΈΡΠ»ΡΡ‚ΡŒ AUC, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ ΠΊΡ€ΠΈΠ²ΠΎΠΉ ROC.
Π˜ΠΌΠΏΠΎΡ€Ρ‚ΠΈΡ€ΡƒΠΉΡ‚Π΅ ΠΈΠ· ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΡ… ΠΌΠΎΠ΄ΡƒΠ»Π΅ΠΉ RandomForestClassifier, GridSearchCV ΠΈ train_test_split.
Π—Π°Π³Ρ€ΡƒΠ·ΠΈΡ‚Π΅ датасСт creditcard.csv ΠΈ создайтС Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌ df.
Π‘ ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° value_counts с Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚ΠΎΠΌ normalize=True ΡƒΠ±Π΅Π΄ΠΈΡ‚Π΅ΡΡŒ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° нСсбалансирована.
Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ ΠΌΠ΅Ρ‚ΠΎΠ΄ info, ΠΏΡ€ΠΎΠ²Π΅Ρ€ΡŒΡ‚Π΅, всС Π»ΠΈ столбцы содСрТат числовыС Π΄Π°Π½Π½Ρ‹Π΅ ΠΈ Π½Π΅Ρ‚ Π»ΠΈ Π² Π½ΠΈΡ… пропусков.
ΠŸΡ€ΠΈΠΌΠ΅Π½ΠΈΡ‚Π΅ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΡƒΡŽ настройку, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΌΠΎΠΆΠ½ΠΎ Π±Ρ‹Π»ΠΎ ΠΏΡ€ΠΎΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°Ρ‚ΡŒ всС столбцы Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌΠ°:

  • pd.options.display.max_columns = 100.
  • ΠŸΡ€ΠΎΡΠΌΠΎΡ‚Ρ€ΠΈΡ‚Π΅ ΠΏΠ΅Ρ€Π²Ρ‹Π΅ 10 строк Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌΠ° df.
  • Π‘ΠΎΠ·Π΄Π°ΠΉΡ‚Π΅ Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌ X ΠΈΠ· Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌΠ° df, ΠΈΡΠΊΠ»ΡŽΡ‡ΠΈΠ² столбСц Class.
  • Π‘ΠΎΠ·Π΄Π°ΠΉΡ‚Π΅ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ Series ΠΏΠΎΠ΄ Π½Π°Π·Π²Π°Π½ΠΈΠ΅ΠΌ y ΠΈΠ· столбца Class.
  • Π Π°Π·Π±Π΅ΠΉΡ‚Π΅ X ΠΈ y Π½Π° Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹ΠΉ ΠΈ тСстовый Π½Π°Π±ΠΎΡ€Ρ‹ Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΡ€ΠΈ ΠΏΠΎΠΌΠΎΡ‰ΠΈ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ train_test_split, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚Ρ‹: test_size=0.3, random_state=100, stratify=y.
  • Π£ вас Π΄ΠΎΠ»ΠΆΠ½Ρ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒΡΡ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ X_train, X_test, y_train ΠΈ y_test.
  • ΠŸΡ€ΠΎΡΠΌΠΎΡ‚Ρ€ΠΈΡ‚Π΅ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ ΠΎ ΠΈΡ… Ρ„ΠΎΡ€ΠΌΠ΅.

Для поиска ΠΏΠΎ сСткС ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² Π·Π°Π΄Π°ΠΉΡ‚Π΅ Ρ‚Π°ΠΊΠΈΠ΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹:
Β Β parameters = [{'n_estimators': [10, 15],
Β Β 'max_features': np.arange(3, 5),
Β Β 'max_depth': np.arange(4, 7)}]

Π‘ΠΎΠ·Π΄Π°ΠΉΡ‚Π΅ модСль GridSearchCV со ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌΠΈ Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚Π°ΠΌΠΈ:
Β Β estimator=RandomForestClassifier(random_state=100),
Β Β param_grid=parameters,
Β Β scoring='roc_auc',
Β Β cv=3.

ΠžΠ±ΡƒΡ‡ΠΈΡ‚Π΅ модСль Π½Π° Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½ΠΎΠΌ Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ… (ΠΌΠΎΠΆΠ΅Ρ‚ Π·Π°Π½ΡΡ‚ΡŒ нСсколько ΠΌΠΈΠ½ΡƒΡ‚).
ΠŸΡ€ΠΎΡΠΌΠΎΡ‚Ρ€ΠΈΡ‚Π΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ Π»ΡƒΡ‡ΡˆΠ΅ΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚Π° best_params_.
ΠŸΡ€Π΅Π΄ΡΠΊΠ°ΠΆΠΈΡ‚Π΅ вСроятности классов с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Π½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° predict_proba.
Из ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½ΠΎΠ³ΠΎ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π° (массив Numpy) Π²Ρ‹Π±Π΅Ρ€ΠΈΡ‚Π΅ столбСц с индСксом 1 (Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ класса 1) ΠΈ Π·Π°ΠΏΠΈΡˆΠΈΡ‚Π΅ Π² массив y_pred_proba.
Из модуля sklearn.metrics ΠΈΠΌΠΏΠΎΡ€Ρ‚ΠΈΡ€ΡƒΠΉΡ‚Π΅ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΡƒ roc_auc_score.
ВычислитС AUC Π½Π° тСстовых Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ сравнитС с Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠΌ,ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹ΠΌ Π½Π° Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ…, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ Π² качСствС Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² массивы y_test ΠΈ y_pred_proba.

* Π”ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ задания:

  1. Π—Π°Π³Ρ€ΡƒΠ·ΠΈΡ‚Π΅ датасСт Wine ΠΈΠ· встроСнных датасСтов sklearn.datasets с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ load_wine Π² ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½ΡƒΡŽ data.
  2. ΠŸΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹ΠΉ датасСт Π½Π΅ являСтся Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌΠΎΠΌ. Π­Ρ‚ΠΎ структура Π΄Π°Π½Π½Ρ‹Ρ…, ΠΈΠΌΠ΅ΡŽΡ‰Π°Ρ ΠΊΠ»ΡŽΡ‡ΠΈ Π°Π½Π°Π»ΠΎΠ³ΠΈΡ‡Π½ΠΎ ΡΠ»ΠΎΠ²Π°Ρ€ΡŽ. ΠŸΡ€ΠΎΡΠΌΠΎΡ‚Ρ€ΠΈΡ‚Π΅ Ρ‚ΠΈΠΏ Π΄Π°Π½Π½Ρ‹Ρ… этой структуры Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ создайтС список data_keys, содСрТащий Π΅Π΅ ΠΊΠ»ΡŽΡ‡ΠΈ.
  3. ΠŸΡ€ΠΎΡΠΌΠΎΡ‚Ρ€ΠΈΡ‚Π΅ Π΄Π°Π½Π½Ρ‹Π΅, описаниС ΠΈ названия ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² Π² датасСтС. ОписаниС Π½ΡƒΠΆΠ½ΠΎ вывСсти Π² Π²ΠΈΠ΄Π΅ ΠΏΡ€ΠΈΠ²Ρ‹Ρ‡Π½ΠΎΠ³ΠΎ, Π°ΠΊΠΊΡƒΡ€Π°Ρ‚Π½ΠΎ ΠΎΡ„ΠΎΡ€ΠΌΠ»Π΅Π½Π½ΠΎΠ³ΠΎ тСкста, Π±Π΅Π· ΠΎΠ±ΠΎΠ·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ пСрСноса строки, Π½ΠΎ с самими пСрСносами ΠΈ Ρ‚.Π΄.
  4. Бколько классов содСрТит цСлСвая пСрСмСнная датасСта? Π’Ρ‹Π²Π΅Π΄ΠΈΡ‚Π΅ названия классов.
  5. На основС Π΄Π°Π½Π½Ρ‹Ρ… датасСта (ΠΎΠ½ΠΈ содСрТатся Π² Π΄Π²ΡƒΠΌΠ΅Ρ€Π½ΠΎΠΌ массивС Numpy) ΠΈ Π½Π°Π·Π²Π°Π½ΠΈΠΉ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² создайтС Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌ ΠΏΠΎΠ΄ Π½Π°Π·Π²Π°Π½ΠΈΠ΅ΠΌ X.
  6. ВыяснитС Ρ€Π°Π·ΠΌΠ΅Ρ€ Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌΠ° X ΠΈ установитС, ΠΈΠΌΠ΅ΡŽΡ‚ΡΡ Π»ΠΈ Π² Π½Π΅ΠΌ ΠΏΡ€ΠΎΠΏΡƒΡ‰Π΅Π½Π½Ρ‹Π΅ значСния.
  7. Π”ΠΎΠ±Π°Π²ΡŒΡ‚Π΅ Π² Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌ ΠΏΠΎΠ»Π΅ с классами Π²ΠΈΠ½ Π² Π²ΠΈΠ΄Π΅ чисСл, ΠΈΠΌΠ΅ΡŽΡ‰ΠΈΡ… Ρ‚ΠΈΠΏ Π΄Π°Π½Π½Ρ‹Ρ… numpy.int64. НазваниС поля - 'target'.
  8. ΠŸΠΎΡΡ‚Ρ€ΠΎΠΉΡ‚Π΅ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρƒ коррСляций для всСх ΠΏΠΎΠ»Π΅ΠΉ X. Π”Π°ΠΉΡ‚Π΅ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½ΠΎΠΌΡƒ Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌΡƒ Π½Π°Π·Π²Π°Π½ΠΈΠ΅ X_corr.
  9. Π‘ΠΎΠ·Π΄Π°ΠΉΡ‚Π΅ список high_corr ΠΈΠ· ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², коррСляция ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… с ΠΏΠΎΠ»Π΅ΠΌ target ΠΏΠΎ Π°Π±ΡΠΎΠ»ΡŽΡ‚Π½ΠΎΠΌΡƒ Π·Π½Π°Ρ‡Π΅Π½ΠΈΡŽ ΠΏΡ€Π΅Π²Ρ‹ΡˆΠ°Π΅Ρ‚ 0.5 (ΠΏΡ€ΠΈΡ‡Π΅ΠΌ, само ΠΏΠΎΠ»Π΅ target Π½Π΅ Π΄ΠΎΠ»ΠΆΠ½ΠΎ Π²Ρ…ΠΎΠ΄ΠΈΡ‚ΡŒ Π² этот список).
  10. Π£Π΄Π°Π»ΠΈΡ‚Π΅ ΠΈΠ· Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌΠ° X ΠΏΠΎΠ»Π΅ с Ρ†Π΅Π»Π΅Π²ΠΎΠΉ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠΉ. Для всСх ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², названия ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… содСрТатся Π² спискС high_corr, вычислитС ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ ΠΈΡ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ ΠΈ Π΄ΠΎΠ±Π°Π²ΡŒΡ‚Π΅ Π² Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌ X ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠ΅ поля с суффиксом '_2', Π΄ΠΎΠ±Π°Π²Π»Π΅Π½Π½ΠΎΠ³ΠΎ ΠΊ ΠΏΠ΅Ρ€Π²ΠΎΠ½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎΠΌΡƒ названию ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ°. Π˜Ρ‚ΠΎΠ³ΠΎΠ²Ρ‹ΠΉ Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌ Π΄ΠΎΠ»ΠΆΠ΅Π½ ΡΠΎΠ΄Π΅Ρ€ΠΆΠ°Ρ‚ΡŒ всС поля, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅, Π±Ρ‹Π»ΠΈ Π² Π½Π΅ΠΌ ΠΈΠ·Π½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎ, Π° Ρ‚Π°ΠΊΠΆΠ΅ поля с ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ°ΠΌΠΈ ΠΈΠ· списка high_corr, Π²ΠΎΠ·Π²Π΅Π΄Π΅Π½Π½Ρ‹ΠΌΠΈ Π² ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚. Π’Ρ‹Π²Π΅Π΄ΠΈΡ‚Π΅ описаниС ΠΏΠΎΠ»Π΅ΠΉ Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌΠ° X с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° describe.

Lesson 08. ΠžΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ Π±Π΅Π· учитСля Π² Scikit-learn.

Π—Π°Π΄Π°Π½ΠΈΠ΅ 1

Π˜ΠΌΠΏΠΎΡ€Ρ‚ΠΈΡ€ΡƒΠΉΡ‚Π΅ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΈ pandas, numpy ΠΈ matplotlib. Π—Π°Π³Ρ€ΡƒΠ·ΠΈΡ‚Π΅ "Boston House Prices dataset" ΠΈΠ· встроСнных Π½Π°Π±ΠΎΡ€ΠΎΠ² Π΄Π°Π½Π½Ρ‹Ρ… Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΈ sklearn. Π‘ΠΎΠ·Π΄Π°ΠΉΡ‚Π΅ Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌΡ‹ X ΠΈ y ΠΈΠ· этих Π΄Π°Π½Π½Ρ‹Ρ…. Π Π°Π·Π±Π΅ΠΉΡ‚Π΅ эти Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌΡ‹ Π½Π° Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹Π΅ (X_train, y_train) ΠΈ тСстовыС (X_test, y_test) с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ train_test_split Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Ρ€Π°Π·ΠΌΠ΅Ρ€ тСстовой Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ составлял 20% ΠΎΡ‚ всСх Π΄Π°Π½Π½Ρ‹Ρ…, ΠΏΡ€ΠΈ этом Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚ random_state Π΄ΠΎΠ»ΠΆΠ΅Π½ Π±Ρ‹Ρ‚ΡŒ Ρ€Π°Π²Π΅Π½ 42. ΠœΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΡƒΠΉΡ‚Π΅ Π΄Π°Π½Π½Ρ‹Π΅ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ StandardScaler. ΠŸΠΎΡΡ‚Ρ€ΠΎΠΉΡ‚Π΅ модСль TSNE Π½Π° Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹ΠΉ Π΄Π°Π½Π½Ρ‹Ρ… с ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π°ΠΌΠΈ: n_components=2, learning_rate=250, random_state=42. ΠŸΠΎΡΡ‚Ρ€ΠΎΠΉΡ‚Π΅ Π΄ΠΈΠ°Π³Ρ€Π°ΠΌΠΌΡƒ рассСяния Π½Π° этих Π΄Π°Π½Π½Ρ‹Ρ….

Π—Π°Π΄Π°Π½ΠΈΠ΅ 2

Π‘ ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ KMeans Ρ€Π°Π·Π±Π΅ΠΉΡ‚Π΅ Π΄Π°Π½Π½Ρ‹Π΅ ΠΈΠ· Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½ΠΎΠ³ΠΎ Π½Π°Π±ΠΎΡ€Π° Π½Π° 3 кластСра, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠΉΡ‚Π΅ всС ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΈ ΠΈΠ· Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌΠ° X_train. ΠŸΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ max_iter Π΄ΠΎΠ»ΠΆΠ΅Π½ Π±Ρ‹Ρ‚ΡŒ Ρ€Π°Π²Π΅Π½ 100, random_state сдСлайтС Ρ€Π°Π²Π½Ρ‹ΠΌ 42. ΠŸΠΎΡΡ‚Ρ€ΠΎΠΉΡ‚Π΅ Π΅Ρ‰Π΅ Ρ€Π°Π· Π΄ΠΈΠ°Π³Ρ€Π°ΠΌΠΌΡƒ рассСяния Π½Π° Π΄Π°Π½Π½Ρ‹Ρ…, ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Ρ… с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ TSNE, ΠΈ Ρ€Π°ΡΠΊΡ€Π°ΡΡŒΡ‚Π΅ Ρ‚ΠΎΡ‡ΠΊΠΈ ΠΈΠ· Ρ€Π°Π·Π½Ρ‹Ρ… кластСров Ρ€Π°Π·Π½Ρ‹ΠΌΠΈ Ρ†Π²Π΅Ρ‚Π°ΠΌΠΈ. ВычислитС срСдниС значСния price ΠΈ CRIM Π² Ρ€Π°Π·Π½Ρ‹Ρ… кластСрах.

Π—Π°Π΄Π°Π½ΠΈΠ΅ 3 *

ΠŸΡ€ΠΈΠΌΠ΅Π½ΠΈΡ‚Π΅ модСль KMeans, ΠΏΠΎΡΡ‚Ρ€ΠΎΠ΅Π½Π½ΡƒΡŽ Π² ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰Π΅ΠΌ Π·Π°Π΄Π°Π½ΠΈΠΈ, ΠΊ Π΄Π°Π½Π½Ρ‹ΠΌ ΠΈΠ· тСстового Π½Π°Π±ΠΎΡ€Π°. ВычислитС срСдниС значСния price ΠΈ CRIM Π² Ρ€Π°Π·Π½Ρ‹Ρ… кластСрах Π½Π° тСстовых Π΄Π°Π½Π½Ρ‹Ρ….

ΠšΡƒΡ€ΡΠΎΠ²ΠΎΠΉ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ для курса "Python для Data Science"

ΠœΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π»Ρ‹ ΠΊ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Ρƒ (Ρ„Π°ΠΉΠ»Ρ‹): train.csv test.csv

Π—Π°Π΄Π°Π½ΠΈΠ΅: Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ Π΄Π°Π½Π½Ρ‹Π΅ ΠΈΠ· train.csv, ΠΏΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ модСль для прСдсказания Ρ†Π΅Π½ Π½Π° Π½Π΅Π΄Π²ΠΈΠΆΠΈΠΌΠΎΡΡ‚ΡŒ (ΠΊΠ²Π°Ρ€Ρ‚ΠΈΡ€Ρ‹). Π‘ ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Ρ‚ΡŒ Ρ†Π΅Π½Ρ‹ для ΠΊΠ²Π°Ρ€Ρ‚ΠΈΡ€ ΠΈΠ· Ρ„Π°ΠΉΠ»Π° test.csv.

ЦСлСвая пСрСмСнная: Price

Основная ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ°: R2 - коэффициСнт Π΄Π΅Ρ‚Π΅Ρ€ΠΌΠΈΠ½Π°Ρ†ΠΈΠΈ (sklearn.metrics.r2_score)

Π’ΡΠΏΠΎΠΌΠΎΠ³Π°Ρ‚Π΅Π»ΡŒΠ½Π°Ρ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ°: MSE - срСдняя квадратичная ошибка (sklearn.metrics.mean_squared_error)

Π‘Π΄Π°Ρ‡Π° ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π°:

  1. ΠŸΡ€ΠΈΡΠ»Π°Ρ‚ΡŒ Π² Ρ€Π°Π·Π΄Π΅Π» Задания Π£Ρ€ΠΎΠΊΠ° 12 ("Π’Π΅Π±ΠΈΠ½Π°Ρ€. ΠšΠΎΠ½ΡΡƒΠ»ΡŒΡ‚Π°Ρ†ΠΈΡ ΠΏΠΎ ΠΈΡ‚ΠΎΠ³ΠΎΠ²ΠΎΠΌΡƒ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Ρƒ") ссылку Π½Π° ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΡƒ Π² github (ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ° Π΄ΠΎΠ»ΠΆΠ½Π° ΡΠΎΠ΄Π΅Ρ€ΠΆΠ°Ρ‚ΡŒΡΡ Π² Ρ„Π°ΠΉΠ»Π΅ Jupyter Notebook с Ρ€Π°ΡΡˆΠΈΡ€Π΅Π½ΠΈΠ΅ΠΌ ipynb).
  2. ΠŸΡ€ΠΈΠ»ΠΎΠΆΠΈΡ‚ΡŒ Ρ„Π°ΠΉΠ» с Π½Π°Π·Π²Π°Π½ΠΈΠ΅ΠΌ ΠΏΠΎ ΠΎΠ±Ρ€Π°Π·Ρ†Ρƒ SShirkin_predictions.csv с прСдсказанными Ρ†Π΅Π½Π°ΠΌΠΈ для ΠΊΠ²Π°Ρ€Ρ‚ΠΈΡ€ ΠΈΠ· test.csv (Ρ„Π°ΠΉΠ» Π΄ΠΎΠ»ΠΆΠ΅Π½ ΡΠΎΠ΄Π΅Ρ€ΠΆΠ°Ρ‚ΡŒ Π΄Π²Π° поля: Id, Price).

Π‘Ρ€ΠΎΠΊΠΈ сдачи: Π‘Π΄Π°Ρ‚ΡŒ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ Π·Π° 72 часа Π΄ΠΎ Π½Π°Ρ‡Π°Π»Π° Π£Ρ€ΠΎΠΊΠ° 13 ("Π’Π΅Π±ΠΈΠ½Π°Ρ€. Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ ΠΈΡ‚ΠΎΠ³ΠΎΠ²Ρ‹Ρ… ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΎΠ² ΠΈ Π·Π°ΠΊΡ€Ρ‹Ρ‚ΠΈΠ΅ курса").

ΠŸΡ€ΠΈΠΌΠ΅Ρ‡Π°Π½ΠΈΠ΅: ВсС Ρ„Π°ΠΉΠ»Ρ‹ csv Π΄ΠΎΠ»ΠΆΠ½Ρ‹ ΡΠΎΠ΄Π΅Ρ€ΠΆΠ°Ρ‚ΡŒ названия ΠΏΠΎΠ»Π΅ΠΉ (header - Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ "ΡˆΠ°ΠΏΠΊΡƒ"), Ρ€Π°Π·Π΄Π΅Π»ΠΈΡ‚Π΅Π»ΡŒ - запятая. Π’ Ρ„Π°ΠΉΠ»Π°Ρ… Π½Π΅ Π΄ΠΎΠ»ΠΆΠ½Ρ‹ ΡΠΎΠ΄Π΅Ρ€ΠΆΠ°Ρ‚ΡŒΡΡ индСксы ΠΈΠ· Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌΠ°.

About

Education

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 100.0%