from bs4 import BeautifulSoup
import urllib.request
stores=[]; // 결과를 저장할 리스트
encText = urllib.parse.quote('서울')
for page in range(1, 17) :
Hollys_url = 'https://www.hollys.co.kr/store/korea/korStore2.do?pageNo=%d&gugun=&store=&sido='%(page)
print(Hollys_url)
html = urllib.request.urlopen(Hollys_url)
soupHollys = BeautifulSoup(html, 'html.parser')
tag_tbody = soupHollys.find('tbody')
for store in tag_tbody.find_all('tr'):
store_info = dict() // 개별 매장 정보를 사전 형태로 저장
store_td = store.find_all('td')
store_name = store_td[1].string; store_info["store_name"] = store_td[1].string
store_sido = store_td[0].string; store_info["store_sido"] = store_td[0].string
store_address = store_td[3].string; store_info["store_address"] = store_td[3].string
store_phone = store_td[5].string; store_info["store_phone"] = store_td[5].string
print('매장명', store_name, '시도구', store_sido, '주소', store_address, '전화번호', store_phone)
stores.append(store_info)
for store in stores :
print(store)
db에 저장
import pymongo
conn=pymongo.MongoClient()
db = conn.bitDB
db.hollys.insert_many(stores)
'JX405기_비트 > mongoDB' 카테고리의 다른 글
| Day18-1 동적 웹페이지 크롤링 (0) | 2023.02.08 |
|---|---|
| Day17-3 몽고 디비와 Phyton 연동 (0) | 2023.02.08 |
| Day17-2 MongoDB 연습 문제3 (0) | 2023.02.08 |
| Day17 -1 인덱싱(단일 인덱스, 복합인덱스), 텍스트 인덱스, 공간 정보 쿼 (0) | 2023.02.08 |
| Day17-0 MongoDB Day16 요약 & SQL과 비교 (0) | 2023.02.08 |