GNews를 활용하여 한국의 AI 뉴스 수집하기
서론
뉴스 수집 자동화는 중요한 정보를 빠르고 효율적으로 얻기 위한 강력한 방법입니다. 특히 GNews는 구글 뉴스를 기반으로 뉴스 기사를 스크래핑하는 파이썬 라이브러리로, 특정 키워드나 언어, 지역에 맞춘 뉴스를 수집하는 데 유용합니다. 이번 글에서는 GNews
모듈에서 제공하는 다양한 수집 옵션을 활용하여 한국의 AI 관련 뉴스를 수집하는 방법을 설명합니다.
본론
1. GNews 설치 및 기본 설정
GNews는 간단하게 설치할 수 있으며, 설치 후 언어, 국가, 키워드 등을 설정해 원하는 뉴스만을 수집할 수 있습니다.
pip install gnews
2. GNews 주요 옵션
GNews에서 제공하는 옵션은 다양하며, 이를 조합해 특정 요구에 맞는 뉴스를 수집할 수 있습니다. 주요 옵션은 다음과 같습니다.
language
: 뉴스 기사의 언어 설정 (예: ‘ko’는 한국어)country
: 국가 설정 (예: ‘KR’은 대한민국)max_results
: 한 번에 가져올 뉴스의 최대 개수search
: 특정 키워드에 맞는 뉴스 검색period
: 뉴스의 기간 설정 (예: ‘7d’는 7일간의 뉴스)
3. 한국의 AI 관련 뉴스 수집하기
3.1 한국어로 된 최신 AI 뉴스 수집
아래 코드는 한국어로 된 최신 AI 관련 뉴스를 수집하는 예제입니다.
from gnews import GNews
# GNews 객체 생성
gnews = GNews(language='ko', country='KR')
# 'AI' 키워드를 포함한 최신 뉴스 검색
ai_news = gnews.get_news('AI')
# 결과 출력
for item in ai_news:
print(f"제목: {item['title']}")
print(f"링크: {item['url']}")
print(f"출판 날짜: {item['published date']}")
print(f"설명: {item['description']}")
print("\n")
위 코드는 AI라는 키워드를 포함한 한국어 뉴스를 가져옵니다. 각 뉴스 기사의 제목, 링크, 출판 날짜, 설명을 출력하여 사용자가 쉽게 확인할 수 있도록 합니다.
3.2 기간 설정: 최근 일주일간의 AI 뉴스
특정 기간 내에 발생한 뉴스를 수집하고 싶을 때는 period
옵션을 사용할 수 있습니다. 아래 코드는 최근 7일간의 AI 관련 뉴스를 검색하는 예제입니다.
from gnews import GNews
# GNews 객체 생성
gnews = GNews(language='ko', country='KR', period='7d')
# 'AI' 키워드를 포함한 최근 7일간의 뉴스 검색
ai_news_week = gnews.get_news('AI')
# 결과 출력
for item in ai_news_week:
print(f"제목: {item['title']}")
print(f"링크: {item['url']}")
print(f"출판 날짜: {item['published date']}")
print(f"설명: {item['description']}")
print("\n")
period='7d'
옵션을 추가하여 최근 일주일 동안의 AI 관련 뉴스를 수집할 수 있습니다.
3.3 최대 뉴스 개수 설정
한 번에 가져올 뉴스의 개수를 조정하려면 max_results
옵션을 사용할 수 있습니다. 아래 코드는 최대 5개의 AI 뉴스를 수집하는 예제입니다.
from gnews import GNews
# GNews 객체 생성, 최대 5개의 뉴스만 가져오기
gnews = GNews(language='ko', country='KR', max_results=5)
# 'AI' 키워드를 포함한 최신 뉴스 검색
ai_news_limited = gnews.get_news('AI')
# 결과 출력
for item in ai_news_limited:
print(f"제목: {item['title']}")
print(f"링크: {item['url']}")
print(f"출판 날짜: {item['published date']}")
print(f"설명: {item['description']}")
print("\n")
이 코드는 max_results=5
를 통해 최대 5개의 뉴스만을 수집하도록 제한을 걸었습니다.
3.4 특정 주제에 대한 뉴스 검색
search
옵션을 사용해 특정 주제의 뉴스를 검색할 수 있습니다. 예를 들어, “인공지능 윤리”라는 키워드로 뉴스를 수집하려면 다음과 같이 작성할 수 있습니다.
from gnews import GNews
# GNews 객체 생성
gnews = GNews(language='ko', country='KR')
# '인공지능 윤리' 키워드를 포함한 뉴스 검색
ethics_news = gnews.get_news('인공지능 윤리')
# 결과 출력
for item in ethics_news:
print(f"제목: {item['title']}")
print(f"링크: {item['url']}")
print(f"출판 날짜: {item['published date']}")
print(f"설명: {item['description']}")
print("\n")
위 코드는 “인공지능 윤리”라는 특정 주제를 다루는 뉴스만을 검색합니다.
4. GNews로 수집한 뉴스 데이터 활용
수집한 뉴스 데이터를 활용하여 데이터베이스에 저장하거나, 텍스트 분석을 통해 트렌드를 분석하는 등 다양한 방법으로 확장할 수 있습니다. 예를 들어, 수집한 뉴스를 분석해 인공지능 기술의 발전 방향을 추적하거나, 특정 회사와 관련된 뉴스를 모니터링하는 등 여러 가능성을 열 수 있습니다.
결론
GNews
모듈은 언어, 국가, 키워드, 기간, 뉴스 개수 등의 옵션을 통해 맞춤형 뉴스 수집 기능을 제공합니다. 이 글에서는 한국에서 AI 관련 뉴스를 수집하는 방법을 다루었으며, 이를 활용하여 다양한 방식으로 뉴스를 자동 수집하고 분석할 수 있습니다. 앞으로 더 많은 주제와 옵션을 조합해 자신만의 뉴스 수집기를 구축해보세요.
참고자료
- GNews 공식 GitHub - https://github.com/ranahaani/GNews
댓글남기기