전체 글 143

Cisco Networking-0 / 프로토콜, 이더넷

1. 프로토콜대화의 규칙 / 통신의 규칙서로 다른 프로토콜을 사용하게 되면 통신, 즉 대화가 불가능인터넷에서는 하나의 언어, 즉 하나의 프로토콜만을 사용하는데 인터넷에서 사용하는 프로토콜이 TCP / IP인터넷의 또 하나의 특징은 주로 익스플로러나 크롬, 파이어폭스와 같은 웹 브라우저를 이용해 인터넷을 탐험* 인터넷은 네트워크를 여러 개 묶어놓은 네트워크 연합을 말하고 이것들은 TCP / IP라는 공통의 프로토콜을 사용한다. 인트라넷은 회사에서 쓰는 여러 가지 프로그램들을 마치 인터넷을 사용하는 것처럼 쓰도록 만들어 놓은 것인데, 인트라넷은 그 회사의 직원 외에는 사용할 수 없다. 그러나 엑스트라넷은 그 사용 범위를 직원 이외에도 협력 회사나 고객까지로 확대한 개념이다. 2. LANLocal Area N..

Cisco Networking-2 / MAC Address

1. MAC Address미디어 엑세스 컨트롤 (Media Access Control)의 준말통신을 위해선 서로를 구분할 일종의 주소가 필요함. (우리가 편지를 서로 주고 받기 위해서 각각의 건물이나 집에 서로 다른 주소가 필요한 것 처럼)IP 주소를 사용하기 때문에 IP 주소만 있으면, 모든 통신이 일어날 것 같지만 사실은 IP 주소를 다시 MAC (ARP: Address Resolution Protocol)이 필요함.Physical address 또는 물리적 주소로 보이는 주소가 자신의 맥 어드레스임2. 라우터를 거치지 않는 하나의 네트워크 안에서의 통신PC Y가 PC Z의 IP 주소를 알고 있음그럼 PC Y는 자신이 속한 네트워크에 있는 모든 PC에 메세지를 보냄 (브로드캐스트)그럼 우리 네트워크에..

Cisco Networking- 1

1. 네트워킹? 리소스를 주고 받기 위해.인터넷-> 프로토콜이 같아야 한다. 2. TCP/IPInternet에서 사용하는 프로토콜Transmission control protocol (transport layer)Internet protocol (Network layer)Intra - net (International network)Intranet vs ExtranetIntranet (within) 다른 사람 접속 불가능Extranet 협력 회사까지 사용함CSMA / CD (Carrier Sense with Collision Detection)3. CSMA/CD케이블을 치환하다보니 충돌이 일어남.그럼 어느정도 random하게 기다리기 (Back off)CSMA/CD의 단점: collision이 일어남.4..

[BeautifulSoup]네이버 증권 인기검색 종목, 해외 증시 크롤링 코드

안녕하세요! 오늘은 네이버 증권 인기검색 종목, 해외 증시 크롤링 코드를 배포하려고 합니다. 1. 네이버 증권 인기종목 크롤링 # 패턴1. 라이브러리 로드 import requests from bs4 import BeautifulSoup # 패턴2. 크롤링하고 싶은 페이지 URL넣음 res = requests.get('https://finance.naver.com/') # 패턴3. 데이터 구조화 soup = BeautifulSoup(res.content,'html.parser') #container > div.aside > div > div.aside_area.aside_popular > table > tbody > tr:nth-child(1) > th > a css = '#container > div...

데이터/데이터 2023.07.23

[BeautifulSoup]뉴스 이슈 리스트 가져오기, 링크 가져오기 코드

안녕하세요! 오늘은 BeautifulSoup을 활용한 뉴스 이슈 리스트 가져오기, 링크 가져오기 코드를 배포합니다. 1. 뉴스 이슈 가져오기 크롤링 코드 # 패턴1. 라이브러리 로드 import requests from bs4 import BeautifulSoup # 패턴2. 크롤링하고 싶은 페이지 URL넣음 res = requests.get('https://news.daum.net/') # 패턴3. 데이터 구조화 #내가 한 방법은 맞음, 패턴을 찾아야함. 근데 select_one이 아니라 select #nchild를 없애니까 len을 하니 20개가 추출됨 soup = BeautifulSoup(res.content,'html.parser') #css = 'body > div.container-doc > ..

데이터/데이터 2023.07.23

[BeautifulSoup] 다음 뉴스, 네이버 뉴스 기사 제목 크롤링 코드

안녕하세요! 오늘은 다음 뉴스기사와 네이버뉴스 기사 크롤링 코드를 배포합니다. 1. 다음 뉴스 기사 제목 크롤링 # 패턴1. 라이브러리 로드 import requests from bs4 import BeautifulSoup head = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/115.0.0.0 Safari/537.36'} url = 'https://news.naver.com/main/read.nhn?mode=LSD&mid=shm&sid1=102&oid=025&aid=0003065817' res = requests.get(url,headers = head) # 패턴..

데이터/데이터 2023.07.23

[BeautifulSoup] 크롤링 패턴 코드 연습하기

안녕하세요! 오늘은 beautifulsoup을 활용한 크롤링 패턴 코드를 연습하려고 합니다. 1. 라이브러리 임포트 request: 웹페이지 가져오기 bs4(BeautifulSoup):웹페이지 분석 라이브러리 import requests from bs4 import BeautifulSoup 2. 웹페이지 가져오기 URL 요청을 하고, HTML을 받는다 requests.get() 함수로 요청한다. res.status_code가 200이면 성공이다. #'https://news.v.daum.net/v/20201230200156918' res = requests.get('https://news.v.daum.net/v/20201230200156918') #200이면 성공 res.status_code 3. 웹페이지..

데이터/데이터 2023.07.23

[BeautifulSoup] 크롤링 환경 설정, 태그, 글자 추출

안녕하세요! 오늘은 크롤링 기초에 대해 정리하겠습니다. 1. BeautifulSoup 환경 구성하기 !pip install beautifulSoup4 먼저 beautifulSoup4를 설치합니다. 이후 bs4라는 패키지로부터 BeautifulSoup라는 모듈을 임포트 합니다. # bs4라는 패키지로부터 BeautifulSoup라는 모듈을 임포트 from bs4 import BeautifulSoup html = """ [1]크롤링이란? 웹페이지에서 필요한 데이터를 추출하는 것 파이썬을 중심으로 다양한 웹크롤링 기술 발달 바로가기 [국내도서]신나는 파이썬 [국내도서] 혼자 공부하는 파이썬 [국내도서] Effective Python 2nd 이펙티브 파이썬 : 파이썬 코딩의 기술 """ html을 가정했을 때 ..

데이터/데이터 2023.07.23

[영수증 분석] 비전공자도 가능한 파이썬으로 영수증 분석하기

안녕하세요! 오늘은 easyocr을 사용해 파이썬으로 영수증을 분석해보려 합니다. https://pypi.org/project/easyocr/ easyocr End-to-End Multi-Lingual Optical Character Recognition (OCR) Solution pypi.org 1. easyocr 환경 만들기 %pip install easyocr 먼저 easyocr을 설치합니다. 이후 링크의 usage에 가서 코드를 복사합니다. import easyocr reader = easyocr.Reader(['en','ko'],gpu=False) # this needs to run only once to load the model into memory result = reader.readtex..