๊ด€๋ฆฌ ๋ฉ”๋‰ด

๋ชฉ๋กDeveolpment Study๐Ÿ—‚๏ธ/Python (3)

bom's happy life

Python(ํŒŒ์ด์ฌ) - ์›น์Šคํฌ๋ž˜ํ•‘(ํฌ๋กค๋ง) ์‚ฌ์šฉ๋ฒ•, bs4

ํฌ๋กค๋ง(crawling)์ด๋ž€ ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•˜๊ณ  ๋ถ„๋ฅ˜ํ•˜๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•œ๋‹ค. ์ฃผ๋กœ ์ธํ„ฐ๋„ท์ƒ์˜ ์›นํŽ˜์ด์ง€๋ฅผ ์ˆ˜์ง‘ํ•ด์„œ ๋ถ„๋ฅ˜ํ•˜๊ณ  ์ €์žฅํ•˜๋Š” ๊ฒƒ์„ ๋œปํ•˜๋ฉฐ ๋ฐ์ดํ„ฐ๊ฐ€ ์–ด๋””์— ์ €์žฅ๋˜์–ด ์žˆ๋Š”์ง€ ์œ„์น˜์— ๋Œ€ํ•œ ๋ถ„๋ฅ˜ ์ž‘์—…์ด ํฌ๋กค๋ง์˜ ์ฃผ์š” ๋ชฉ์ ์ด๋‹ค. [Google 'ํฌ๋กค๋ง ๋œป'] # "ํฌ๋กค๋ง"์„ ํ•˜๋ ค๋ฉด ๋‘๊ฐ€์ง€ ์ผ์„ ํ•ด์•ผํ•œ๋‹ค. 1. ์ฃผ์†Œ์ฐฝ์— ์š”์ฒญํ•ด์„œ html์„ ๊ฐ€์ ธ์™€์•ผ ํ•œ๋‹ค. ( ์•ž์ „์— requests๋ฅผ ๊ฐ€์ง€๊ณ  ์ด๋ฏธ ํ•ด๋ณธ ๊ฒƒ.) 2. beautifulsoup ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ์‚ฌ์šฉํ•ด์„œ ๋‚ด๊ฐ€ ์›ํ•˜๋Š” ์ •๋ณด๋ฅผ ๊ฐ€์ ธ์˜จ๋‹ค. beautifulsoup ์„ค์น˜ํ•˜๊ธฐ(requests ์„ค์น˜ ๋•Œ๋ž‘ ๊ฐ™์Œ) 'ํŒŒ์ผ' → '์„ค์ •' → 'ํ”„๋กœ์ ํŠธ: prac_python' → Python ์ธํ„ฐํ”„๋ฆฌํ„ฐ ํ™”๋ฉด์—์„œ + ๋ฒ„ํŠผ ๋ˆ„๋ฆ„. → 'bs4' ๊ฒ€์ƒ‰ํ•ด์„œ ์„ค์น˜! # ์ง€๊ธˆ๋ถ€ํ„ฐ bea..

Python(ํŒŒ์ด์ฌ) - ํŒจํ‚ค์ง€ ์„ค์น˜, requests ๋ง›๋ณด๊ธฐ

ํฌ๋กค๋งํ•˜๋ ค๋ฉด ๋‚จ๋“ค์ด ๋งŒ๋“ค์–ด ๋†“์€ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ์‚ฌ์šฉํ•ด์•ผ ํ•œ๋‹ค. ์ด๊ฑฐ๋ฅผ ํŒŒ์ด์ฌ์—์„œ๋Š” "ํŒจํ‚ค์ง€"๋ผ๊ณ  ๋ถ€๋ฅธ๋‹ค. 1) ํŒŒ์ด์ฌ ํŒจํ‚ค์ง€(package) ์„ค์น˜ํ•˜๊ธฐ ํŒŒ์ด์ฌ์—์„œ ํŒจํ‚ค์ง€๋Š” ๋ชจ๋“ˆ(์ผ์ข…์˜ ๊ธฐ๋Šฅ๋“ค ๋ฌถ์Œ)์„ ๋ชจ์•„ ๋†“์€ ๋‹จ์œ„. ์ด๋Ÿฐ ํŒจํ‚ค์ง€์˜ ๋ฌถ์Œ์„ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ ๋ผ๊ณ  ๋ณผ ์ˆ˜ ์žˆ๋‹ค. ์ง€๊ธˆ ์—ฌ๊ธฐ์„œ๋Š” ์™ธ๋ถ€ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ์‚ฌ์šฉํ•˜๊ธฐ ์œ„ํ•ด์„œ ํŒจํ‚ค์ง€๋ฅผ ์„ค์น˜ํ•œ๋‹ค. ์ฆ‰, ์—ฌ๊ธฐ์„œ๋Š” ํŒจํ‚ค์ง€ ์„ค์น˜ = ์™ธ๋ถ€ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ ์„ค์น˜ ๋ผ๊ณ  ๋ณด๋ฉด ๋œ๋‹ค! pip(python install package) ์‚ฌ์šฉ - requests ํŒจํ‚ค์ง€ ์„ค์น˜ํ•ด๋ณด๊ธฐ (์•ฑ์„ ์„ค์น˜ํ•  ๋•Œ ์•ฑ์Šคํ† ์–ด/ํ”Œ๋ ˆ์ด์Šคํ† ์–ด๋ฅผ ๊ฐ€๋“ฏ์ด, ์ƒˆ๋กœ์šด ํ”„๋กœ์ ํŠธ์˜ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ๊ฐ€์ƒํ™˜๊ฒฝ(๊ณต๊ตฌํ•จ)์— ์„ค์น˜ํ•˜๋ ค๋ฉด pip ๋ฅผ ์ด์šฉํ•˜๊ฒŒ ๋œ๋‹ค.) ------ ์ขŒ์ธก ์ƒ๋‹จ 'ํŒŒ์ผ' → '์„ค์ •' → 'ํ”„๋กœ์ ํŠธ: prac_pyt..

Python(ํŒŒ์ด์ฌ) - ๊ธฐ์ดˆ๋ฌธ๋ฒ•

1. ๋ณ€์ˆ˜ & ๊ธฐ๋ณธ์—ฐ์‚ฐ ํŒŒ์ด์ฌ์€ ๋ณ€์ˆ˜๋ฅผ ์ •์˜ํ•  ๋•Œ let์ด ํ•„์š”๊ฐ€ ์—†๋‹ค. (์ž๋ฐ”์Šคํฌ๋ฆฝํŠธ์—์„œ ์‚ฌ์šฉํ–ˆ๋˜ let) print ํ•ด์„œ ๋งˆ์šฐ์Šค ์šฐํด๋ฆญ → ์‹คํ–‰ → ๋ฐ‘์— ๊ฐ’์ด ๋‚˜์˜จ๋‹ค. * ์ฃผ์˜ํ•  ์  : bom๊ณผ kim์— ' ' ๊ผญ ์ž‘์€๋”ฐ์˜ดํ‘œ๋ฅผ ๋ถ™์—ฌ์ค˜์•ผํ•œ๋‹ค! ์•ˆ๊ทธ๋Ÿฌ๋ฉด ์ ์šฉ์ด ์•ˆ๋จ. 2. listํ˜•๊ณผ dictionaryํ˜• (1) listํ˜• a_list = [ ] ๋ฆฌ์ŠคํŠธ์— ์ถ”๊ฐ€ํ•˜๊ธฐ a_list.append( ) ↓ * javascript์—์„œ๋Š” ๋ฆฌ์ŠคํŠธ์— ์ถ”๊ฐ€ํ•  ๋•Œ .push( )๋ฅผ ์‚ฌ์šฉํ–ˆ๋Š”๋ฐ, python์—์„œ๋Š” ๋ฆฌ์ŠคํŠธ์— ์ถ”๊ฐ€ํ•  ๋•Œ .append( )๋ฅผ ์‚ฌ์šฉํ•œ๋‹ค. (2) dictionaryํ˜• a_dict ์•ˆ์— 'name'๊ฐ’์€? → bob ์ค‘๊ฐ„์— ํ•œ๋ฒˆ๋” ๊ธฐ์–ตํ•  ๊ฒƒ! ๊ผญ ์‹คํ–‰ํ•  ๋•Œ๋Š” ๋งˆ์šฐ์Šค ์šฐํด๋ฆญํ•ด์„œ '์‹คํ–‰' ๋ˆŒ๋Ÿฌ์ฃผ๊ธฐ! 3. ํ•จ..