목록Programming Language/Python (11)
091
* 구글 코랩에서 사용되는 명령어입니다. *1. 웹 크롤링- 웹 크롤링이란 웹 사이트에서 자동으로 데이터를 수집하는 과정을 말하며, 비슷한 의미로 특정 페이지에서 필요한 데이터를 추출하는 과정인 스크래핑이 있습니다. -> 사이트에서 데이터를 추출!!, 자동이기 때문에 정확하지 않을 수도 있습니다. - 이 과정에서 사용되는 두 가지 라이브러리가 있습니다.1️⃣ urllib.request : 웹 페이지의 HTML 소스를 가져오는데 사용됩니다. 2️⃣ BeautifulSoup : 가져온 HTML 소스를 파싱하여 필요한 데이터를 추출하는데 사용됩니다. !pip install bs4 # 사용전 bs4를 깔아줘야합니다 (1) urllib.request와 bs4를 함께 사용import urllib.requestim..
* 구글 코랩에서 사용되는 명령어입니다. * 0. 파일 입출력- 구글 코랩 환경에서 로컬 파일 업로드, 다운로드 기능을 Colab 환경에서 쉽게 쓸 수 있게 해주기 위해 사용하는 명령어입니다.from google.colab import filesf = files.upload()-> 파일을 업로드하는 함수와 모듈을 추가하는 것입니다. from... import...의 경우, 모듈 안의 특정 함수나 클래스를 직접 가져올 때 사용합니다. - csv와 xlsx 차이구분CSV(Comma-separated Value)XLSX확장자.csv.xlsx형식텍스트 기반(콤마로 구분 가능)바이너리 기반(엑셀 전용 포맷)내용 구조단순한 데이터여러 시트, 서식, 수식, 그래프 등 포함 가능용량/속도가볍고 빠름무겁지만 기능이 많음..
1. 자료형- Python에서는 변수명을 지정할 때 문자나 _(언더스코어)로만 작성할 수 있다. - 주요 자료형으로는 숫자형(int, float 등), 문자열형, 리스트형, 튜플형, 집합형, 딕셔너리형이 있다. 1️⃣ 숫자 타입 : int, float, complex(복소수) 3가지로 구성되어있습니다.2️⃣ 불리언 타입 : bool형은 True, False 두 가지 결과값을 가지고 있습니다.3️⃣ 시퀀스 타입 : str, list, tuple, range가 있으며, str의 경우, 텍스트 타입으로 구분하기도 합니다. • 문자열형 : 문자열은 인덱싱, 슬라이싱이 가능하고, 불변 성질이 있습니다. 특수문자를 사용할 때는 이스케이프 시퀀스를 이용해야합니다. • 리스트형 : 여러 개의 값을 저장하는 자료형, ..