본문 바로가기

Python 기본기4

Python 웹 스크래핑 기초 – 초보자도 가능한 데이터 수집 자동화 Python 웹 스크래핑 기초 – 초보자도 가능한 데이터 수집 자동화웹 페이지에서 필요한 정보를 자동으로 가져오는 기술을 웹 스크래핑(Web Scraping)이라고 합니다. 뉴스 기사, 쇼핑몰 가격, 날씨 정보 등 반복적으로 확인하는 데이터를 자동으로 수집하면 시간을 크게 절약할 수 있습니다.1. 준비물pip install requests beautifulsoup4requests는 웹 페이지에 접속하는 라이브러리이고, BeautifulSoup은 HTML 문서를 분석하는 도구입니다.2. HTML 구조 이해하기웹 페이지는 기본적으로 HTML 태그로 구성됩니다. 예를 들어:오늘의 날씨28도이 구조에서 h1은 제목, p 태그는 온도 정보를 담고 있습니다.3. 기본 예제import requestsfrom bs4 .. 2025. 8. 19.
Python으로 PDF 데이터 추출하기 – 초보자도 가능한 업무 자동화 Python으로 PDF 데이터 추출하기 – 초보자도 가능한 업무 자동화보고서, 계약서, 청구서처럼 중요한 문서가 PDF로만 제공될 때, 데이터를 일일이 복사·붙여넣기 하는 대신 Python으로 자동 추출하면 업무 시간을 크게 줄일 수 있습니다.1. 필요한 라이브러리 설치PDF 처리에는 PyPDF2 또는 pdfplumber를 많이 사용합니다.pip install PyPDF2 pdfplumber2. 기본 – 텍스트 추출import PyPDF2with open("sample.pdf", "rb") as f: reader = PyPDF2.PdfReader(f) text = "" for page in reader.pages: text += page.extract_text() pri.. 2025. 8. 14.
Python으로 엑셀 업무 자동화하기 – 매크로 대신 파이썬 활용법(초보 가이드) Python으로 엑셀 업무 자동화하기 – 매크로 대신 파이썬 활용법(초보 가이드)엑셀 반복 작업 많음 → 파이썬으로 자동화 추천함. 설치부터 읽기/쓰기 기본, 폴더 일괄 처리, VBA와 비교까지 한 번에 정리함.왜 파이썬으로 하나?복잡한 전처리/후처리 가능함(Pandas, openpyxl 등 생태계 풍부함)여러 파일 일괄 처리 쉬움(폴더 루프만 돌리면 끝임)윈도우/맥/리눅스 어디서나 실행 가능함버전 관리·자동화 파이프라인과 궁합 좋음준비물(설치)Python 3.x 설치에디터: VS Code 추천(Python 확장 설치)필수 라이브러리 설치:pip install openpyxl pandas회사 PC 정책으로 pip 제한 있을 수 있음 → 가상환경(python -m venv .venv) 사용 권장함.기본: .. 2025. 8. 12.
[debugging] core dump error 1. 환경 사용 운영체제: Rocky LINUX 8 개발 언어: Python 3.9 miniconda에 별도의 환경을 구성하여 Python 3.9 설치 GUI는 개발 과정 중의 손쉬운 수정을 위해 PySide6를 사용하여 작성 하드웨어와 연결하는 소프트웨어를 제외하고 나머지 소프트웨어들은 메시지 통신 메시지 통신은 RabbitMQ Server를 사용 2. 사용자 화면 내의 주요 기능 하드웨어 상태 모니터링 촬영 화면 뷰어 뷰어 상의 마우스 클릭 이후 계산 과정 하드웨어로부터 이미지 얻어오는 반복 기능 리스트뷰(QPlainTextEdit)에 로그 보여주기 3. 반복 기능 구현 메시지 통신을 위해 queue를 감시하는 Thread 여러 개 ProgressBar 동작을 위한 QTimer 두 개 4. 에러 메시.. 2023. 11. 8.