본문 바로가기
TIL

TIL 4일차 - 3주차 파이썬, 크롤링, DB, mongoDB, pymongo로 DB 조작하기

by 유안찡 2022. 11. 4.

3-02. 연습 겸 복습 - 스파르타피디아에 OpenAPI 붙여보기

 

 

1. 스파르타가 만들어둔 OpenAPI 파악하기

- 나홀로 메모장에 들어가는 아티클들의 정보를 불러오는 OpenAPI다. 

- 이 API를 써서 저장된 포스팅 불러오기를 만들어보자!

 

 

 

 

 

2. 로딩 후 바로실행 코드 

$(document).ready(function(){
  listing();
});

function listing() {
console.log('화면 로딩 후 잘 실행되었습니다');
}

 

 

 

 

3. API 결과값을 다시한번 확인하기

 

$(document).ready(function(){
  listing();
});

function listing() {
$.ajax({
  type: "GET",
  url: "http://spartacodingclub.shop/web/api/movie",
  data: {},
  success: function(response){
console.log(response)
  }
})
}

 

 

 

 

4. 영화 데이터를 console에 찍어봅시다!

 

 

$.ajax({
  type: "GET",
  url: "http://spartacodingclub.shop/web/api/movie",
  data: {},
  success: function(response){
        console.log(response['movies'])
  }
})

 

 

 

 

 

5. movies를 돌면서, 하나씩 출력해봅니다. 

 

 

$.ajax({
  type: "GET",
  url: "http://spartacodingclub.shop/web/api/movie",
  data: {},
  success: function(response){
        let movies = response['movies']
        for (let i = 0 ; i < movies.length; i++) {
            let movie = movies[i]
            console.log(movie)
        }
  }
})

 

 

 

 

 

6. movie 내용을 (image, comment, title, desc, star) 가지고 HTML을 만들어 붙입니다. 

 

 

 

$.ajax({
    type: "GET",
    url: "http://spartacodingclub.shop/web/api/movie",
    data: {},
    success: function(response){
          let movies = response['movies']
          for (let i = 0 ; i < movies.length; i++) {
              let movie = movies[i]
              let title = movie['title']
              let desc = movie['desc']
              let image = movie['image']
              let comment = movie['comment']
              let star = movie['star']

              let temp_html = `<div class="col">
                                  <div class="card h-100">
                                      <img src="${image}"
                                           class="card-img-top">
                                      <div class="card-body">
                                          <h5 class="card-title">${title}</h5>
                                          <p class="card-text">${desc}</p>
                                          <p>${star}</p>
                                          <p class="mycomment">${comment}</p>
                                      </div>
                                  </div>
                              </div>`
              $('#cards-box').append(temp_html)
          }
    }
  })

 

 

 

 

7. 먼저 있던 카드들을 지워줍니다. 

 

$('#cards-box').empty()

 

 

 

 

두번째보는데 이제야 이해를 하고 있는 중!! 

기쁘다!!

 

 

 

 

 

 

 

3-03. 파이썬 시작하기

 

 

 

1. 바탕화면에 sparta -> pythonprac 폴더를 만들고 시작하기 !

 

 

2. 파이썬을 설치한다는 것의 의미

- 일종의 번역팩을 설치한다고 생각하면 된다. 

 컴퓨터는 1010과 같은 언어만 알아듣는데 파이썬 문법으로 된 것을 1010으로 변환해줄 수 있도록 번역 패키지를 설치하는 것

 

 

3. 프로젝트 만들기 & 파이썬 파일 실행

- 파일 -> new project 를 클릭

- location은 pythonprac으로 잡기 

- hello.py 안에 다음 내용을 붙여넣고, 마우스 오른쪽 키 -> '실행' 하기 

 

print('hello sparta!!')

 

 

 

 

 

3-04. 파이썬 기초공부 (1)

 

 

 

 

1. 변수 & 기본연산 

 

 

a = 3      # 3을 a에 넣는다
b = a      # a를 b에 넣는다
a = a + 1  # a+1을 다시 a에 넣는다

num1 = a*b # a*b의 값을 num1이라는 변수에 넣는다
num2 = 99 # 99의 값을 num2이라는 변수에 넣는다

# 변수의 이름은 마음대로 지을 수 있음!
# 진짜 "마음대로" 짓는 게 좋을까? var1, var2 이렇게?

 

 

 

 

2. 자료형

 

1) 숫자, 문자형 

 

name = 'bob' # 변수에는 문자열이 들어갈 수도 있고,
num = 12 # 숫자가 들어갈 수도 있고,

is_number = True # True 또는 False -> "Boolean"형이 들어갈 수도 있습니다.

#########
# 그리고 List, Dictionary 도 들어갈 수도 있죠. 그게 뭔지는 아래에서!

 

 

 

2) 리스트 형 (자스의 배열형과 동일)

 

a_list = []
a_list.append(1)     # 리스트에 값을 넣는다
a_list.append([2,3]) # 리스트에 [2,3]이라는 리스트를 다시 넣는다

# a_list의 값은? [1,[2,3]]
# a_list[0]의 값은? 1
# a_list[1]의 값은? [2,3]
# a_list[1][0]의 값은? 2

 

 

 

 

3) dictionary 형 (자스의 딕셔너리형과 동일)

 

a_dict = {}
a_dict = {'name':'bob','age':21}
a_dict['height'] = 178

# a_dict의 값은? {'name':'bob','age':21, 'height':178}
# a_dict['name']의 값은? 'bob'
# a_dict['age']의 값은? 21
# a_dict['height']의 값은? 178

 

 

 

 

4) dictionary 형과 list 형의 조합 

 

people = [{'name':'bob','age':20},{'name':'carry','age':38}]

# people[0]['name']의 값은? 'bob'
# people[1]['name']의 값은? 'carry'

person = {'name':'john','age':7}
people.append(person)

# people의 값은? [{'name':'bob','age':20},{'name':'carry','age':38},{'name':'john','age':7}]
# people[2]['name']의 값은? 'john'

 

 

 

 

3. 함수 - 함수의 정의 - 이름은 마음대로 정할 수 있음

 

def sum(a, b):
    print('더하자!')
    return a + b
    # a+b로 나를 변신시켜라. 그러면 sum(a,b)가 3이 되겠죠. 3이 result에 들어가고 3이 찍힌다.


    result = sum(1, 2)
    # sum(1,2)를 넣었다. 그러면 1,2가 맨 위에 sum에 들어간다. 그 다음 print가 실행된다.
    # 그 다음에 3으로 나를 변신하자. 그럼 sum(1,2)가 3이 될 거고, result에 3이 들어가서 3이 찍힌다.
    # 1,2를 sum(a,b)에다 넣어서 얘가 실행된다.
    print(result)

 

 

 

 

 

 

3-05. 파이썬 기초공부 (2)

 

 

 

1. 조건문 

 

- if / else 로 구성 

 

def is_adult(age):

if age >  20:

     print('성인입니다')       # 조건이 참이면 성인입니다를 출력

else:

     print('청소년이에요')   # 조건이 거짓이면 청소년이에요를 출력 

 

is_adult(30)      #무엇이 출력될까요? 

 

 

 

 

2. 반복문

 

1) 반복문의 특징 

 

- 파이썬에서의 반복문은, 리스트의 요소들을 하나씩 꺼내쓰는 형태입니다. 

- 즉, 무조건 리스트와 함께 쓰입니다!

 

fruits = ['사과', '배', '감', '귤']

 

for fruit in fruits:

     print(fruit)

 

# 사과, 배, 감, 귤 하나씩 꺼내어 찍힙니다. 

 

 

 

2) 리스트 예제 응용 

 

fruits = ['사과','배','배','감','수박','귤','딸기','사과','배','수박']

 

count = 0

for fruit in fruits:

     if fruit == '사과':

         count += 1

 

print(count)

 

# 사과의 갯수를 세어 보여줍니다. 

 

 

 

 

3) 딕셔너리 예제 

 

people = [{'name': 'bob', 'age': 20}, 
          {'name': 'carry', 'age': 38},
          {'name': 'john', 'age': 7},
          {'name': 'smith', 'age': 17},
          {'name': 'ben', 'age': 27}]

 

 

# 모든 사람의 이름과 나이를 출력해봅시다. 

for person in people: 

     print(person['name'], person['age'])

 

 

# 이번엔, 반복문과 조건문을 응용한 함수를 만들어봅시다. 

# 이름을 받으면, age를 리턴해주는 함수 

def get_age(myname) : 

     for person in people:

          if person['name'] == myname:

                return person['age']

      return '해당하는 이름이 없습니다'

 

 

print(get_age('bob'))

print(get_age('kay'))

 

 

 

 

3-06. 파이썬 패키지 설치하기

 

 

 

1. 파이썬 패키지 설치하기 

- 파이썬에서 패키지는 모듈(일종의 기능들 묶음)을 모아 놓은 단위. 이런 패키지의 묶음을 라이브러리라고 볼 수 있다. 

지금 여기서는 외부 라이브러리를 사용하기 위해서 패키지를 설치한다. 

 

즉, 패키지 설치 = 외부 라이브러리 설치!

 

 

 

1) 가상환경이란? 

- 프로젝트별로 패키지들을 담을 공구함

 

다 다른 패키지를 쓰더라도 

다 담아둘 필요 없이 공구함 2개를 만들어서 

공구함1에 a,b',c를 담아두고, 

공구함2에 b,c,d를 담아두고 쓰면 관리하기 편하다. 

 

그래서 가상환경이라는 개념이 등장했다. 

즉, 프로젝트별 공구함이다. 

 

-> 가상환경은 같은 시스템에서 실행되는 다른 파이썬 응용 프로그램들의 동작에 영향을 주지 않기 위해, 

파이썬 배포 패키지들을 설치하거나 업그레이드 하는 것을 가능하게 하는 격리된 실행 환경이다. 

 

 

 

2) pip(python install package) 사용 - requests 패키지 설치해보기 

 

- 앱을 설치할 때 앱스토어/플레이스토어를 가듯, 

새로운 프로젝트의 라이브러리를 가상환경(공구함)에 설치하려면 pip를 이용하게 된다. 

- requests 설치하기

 

 

 

 

 

3-07. 패키지 사용해보기

 

 

 

1. requests 라이브러리 사용해보기 + list/dictionary/함수/if/for문 연습 

 

1) requests 써보기

 

import requests # requests 라이브러리 설치 필요

 

r = requests.get('http://spartacodingclub.shop/sparta_api/seoulair')

rjson = r.json()

 

 

 

 

 

2. 모든 구의 IDEX_MVL 값을 찍어주자! 

 

import requests # requests 라이브러리 설치 필요

 

r = requests.get('http://spartacodingclub.shop/sparta_api/seoulair')

rjson = r.json()

 

rows = rjson['RealtimeCityAir']['row']

 

for row in rows:

print(gu['MSRSTE_NM'], gu['IDEX_MVL'])

 

 

 

 

 

3. IDEX_MVL 값이 60미만인 구만 찍어주자

 

import requests # requests 라이브러리 설치 필요

 

r = requests.get('http://spartacodingclub.shop/sparta_api/seoulair')

rjson = r.json()

 

rows = rjson['RealtimeCityAir']['row']

 

for row in rows:

     gu_name = row['MSRSTE_NM']

     gu_mise = row['IDEX_MVL']

     if gu_mise < 60:

            print(gu_name)  

 

 

 

 

 

 

 

3-12. mongoDB 연결하기

 

 

 

 

1. 몽고디비 - atlas 연결하기 

 

 

1) pymongo 라이브러리의 역할 

- mongoDB라는 프로그램을 조작하려면 특별한 라이브러리, pymongo가 필요하다. 

 

 

 

 

2) pymongo 기본 코드

 

from pymongo import MongoClient
client = MongoClient('여기에 URL 입력')
db = client.dbsparta

 

 

 

 

 

 

3-13. pymongo로 DB조작하기

 

 

 

 

 

1. pymongo로 mongoDB 조작하기 

 

파이썬이라는 프로그래밍 언어를 가지고 

데이터베이스에 데이터를 넣거나 가져오거나 수정하거나 삭제하는 것을 배울 것이다. 

 

 

 

 

 

2. pymongo로 mongoDB 수정하기 

 

# 오타가 많으니 이 줄을 복사해서 씁시다!
db.users.update_one({'name':'bobby'},{'$set':{'age':19}})

user = db.users.find_one({'name':'bobby'})
print(user)

 

- users라는 데에 가서 업데이트를 하나 하는데

조건이 뭐냐면 name이 bobby인 애를 찾아서 age를 19로 만들어라 

 

 

 

 

 

3. pymongo로 mongoDB 삭제하기 

 

db.users.delete_one({'name':'bobby'})

user = db.users.find_one({'name':'bobby'})
print(user)

 

 

 

4. pymongo 사용법. 코드 요약

 

# 저장 - 예시
doc = {'name':'bobby','age':21}
db.users.insert_one(doc)

# 한 개 찾기 - 예시
user = db.users.find_one({'name':'bobby'})

# 여러개 찾기 - 예시 ( _id 값은 제외하고 출력)
all_users = list(db.users.find({},{'_id':False}))

# 바꾸기 - 예시
db.users.update_one({'name':'bobby'},{'$set':{'age':19}})

# 지우기 - 예시
db.users.delete_one({'name':'bobby'})

 

 

 

 

 

 

 

 

3-14. 웹스크래핑 결과 저장하기

 

 

1. 도큐먼트 만들어 하나씩 insert하기 

import requests
from bs4 import BeautifulSoup

from pymongo import MongoClient
client = MongoClient('mongodb+srv://test:sparta@cluster0.55vah.mongodb.net/Cluster0?retryWrites=true&w=majority')
db = client.dbsparta

# URL을 읽어서 HTML를 받아오고,
headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get('<https://movie.naver.com/movie/sdb/rank/rmovie.naver?sel=pnt&date=20210829>',headers=headers)

# HTML을 BeautifulSoup이라는 라이브러리를 활용해 검색하기 용이한 상태로 만듦
soup = BeautifulSoup(data.text, 'html.parser')

# select를 이용해서, tr들을 불러오기
movies = soup.select('#old_content > table > tbody > tr')

# movies (tr들) 의 반복문을 돌리기
for movie in movies:
    # movie 안에 a 가 있으면,
    a_tag = movie.select_one('td.title > div > a')
    if a_tag is not None:
        rank = movie.select_one('td:nth-child(1) > img')['alt'] # img 태그의 alt 속성값을 가져오기
        title = a_tag.text                                      # a 태그 사이의 텍스트를 가져오기
        star = movie.select_one('td.point').text                # td 태그 사이의 텍스트를 가져오기
        doc = {
            'rank': rank,
            'title': title,
            'star': star
        }
        db.movies.insert_one(doc)

 

 

 

 

 

 

 

3-15. Quiz_웹스크래핑 결과 이용하기

 

 

 

1. find, update 연습하기 

 

 

 

 

1) 영화제목 '가버나움'의 평점을 가져오기 

 

target_movie = db.movies.find_one({'title':'가버나움'})
print(target_movie['star'])

 

 

 

 

2) '가버나움'의 평점과 같은 평점의 영화 제목들을 가져오기 

 

target_movie = db.movies.find_one({'title':'가버나움'})
target_star = target_movie['star']

movies = list(db.movies.find({'star':target_star}))

for movie in movies:
    print(movie['title'])

 

 

 

 

3) '가버나움' 영화의 평점을 0으로 만들기 

 

db.movies.update_one({'title':'가버나움'},{'$set':{'star':'0'}})

 

 

 

 

 

 

 

3-16. 3주차 끝 & 숙제 설명

 

 

1. 지니뮤직 사이트에서 순위 / 곡 제목 / 가수를 스크래핑 하기 

 

 

1) 크롤링 기본 준비를 하려면 hello.py에서 그냥 가져오기 

 

2) 앞에서 두글자만 끊기 text[0:2]

 

3) 순위와 곡제목이 깔끔하게 나오진 않을 거기 때문에 파이썬 내장 함수인 strip()을 잘 연구하기 

import requests
from bs4 import BeautifulSoup

headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get('https://www.genie.co.kr/chart/top200?ditc=M&rtm=N&ymd=20210701',headers=headers)

soup = BeautifulSoup(data.text, 'html.parser')

trs = soup.select('#body-content > div.newest-list > div > table > tbody > tr')

for tr in trs:
    rank = tr.select_one('td.number').text[0:2].strip()
    title = tr.select_one('td.info > a.title.ellipsis').text.strip()
    artist = tr.select_one('a.artist.ellipsis').text

    print(rank, title, artist)