서론

뉴스 수집 자동화는 중요한 정보를 빠르고 효율적으로 얻기 위한 강력한 방법입니다. 특히 GNews는 구글 뉴스를 기반으로 뉴스 기사를 스크래핑하는 파이썬 라이브러리로, 특정 키워드나 언어, 지역에 맞춘 뉴스를 수집하는 데 유용합니다. 이번 글에서는 GNews 모듈에서 제공하는 다양한 수집 옵션을 활용하여 한국의 AI 관련 뉴스를 수집하는 방법을 설명합니다.

본론

1. GNews 설치 및 기본 설정

GNews는 간단하게 설치할 수 있으며, 설치 후 언어, 국가, 키워드 등을 설정해 원하는 뉴스만을 수집할 수 있습니다.

pip install gnews

2. GNews 주요 옵션

GNews에서 제공하는 옵션은 다양하며, 이를 조합해 특정 요구에 맞는 뉴스를 수집할 수 있습니다. 주요 옵션은 다음과 같습니다.

  • language: 뉴스 기사의 언어 설정 (예: ‘ko’는 한국어)
  • country: 국가 설정 (예: ‘KR’은 대한민국)
  • max_results: 한 번에 가져올 뉴스의 최대 개수
  • search: 특정 키워드에 맞는 뉴스 검색
  • period: 뉴스의 기간 설정 (예: ‘7d’는 7일간의 뉴스)

3. 한국의 AI 관련 뉴스 수집하기

3.1 한국어로 된 최신 AI 뉴스 수집

아래 코드는 한국어로 된 최신 AI 관련 뉴스를 수집하는 예제입니다.

from gnews import GNews

# GNews 객체 생성
gnews = GNews(language='ko', country='KR')

# 'AI' 키워드를 포함한 최신 뉴스 검색
ai_news = gnews.get_news('AI')

# 결과 출력
for item in ai_news:
    print(f"제목: {item['title']}")
    print(f"링크: {item['url']}")
    print(f"출판 날짜: {item['published date']}")
    print(f"설명: {item['description']}")
    print("\n")

위 코드는 AI라는 키워드를 포함한 한국어 뉴스를 가져옵니다. 각 뉴스 기사의 제목, 링크, 출판 날짜, 설명을 출력하여 사용자가 쉽게 확인할 수 있도록 합니다.

3.2 기간 설정: 최근 일주일간의 AI 뉴스

특정 기간 내에 발생한 뉴스를 수집하고 싶을 때는 period 옵션을 사용할 수 있습니다. 아래 코드는 최근 7일간의 AI 관련 뉴스를 검색하는 예제입니다.

from gnews import GNews

# GNews 객체 생성
gnews = GNews(language='ko', country='KR', period='7d')

# 'AI' 키워드를 포함한 최근 7일간의 뉴스 검색
ai_news_week = gnews.get_news('AI')

# 결과 출력
for item in ai_news_week:
    print(f"제목: {item['title']}")
    print(f"링크: {item['url']}")
    print(f"출판 날짜: {item['published date']}")
    print(f"설명: {item['description']}")
    print("\n")

period='7d' 옵션을 추가하여 최근 일주일 동안의 AI 관련 뉴스를 수집할 수 있습니다.

3.3 최대 뉴스 개수 설정

한 번에 가져올 뉴스의 개수를 조정하려면 max_results 옵션을 사용할 수 있습니다. 아래 코드는 최대 5개의 AI 뉴스를 수집하는 예제입니다.

from gnews import GNews

# GNews 객체 생성, 최대 5개의 뉴스만 가져오기
gnews = GNews(language='ko', country='KR', max_results=5)

# 'AI' 키워드를 포함한 최신 뉴스 검색
ai_news_limited = gnews.get_news('AI')

# 결과 출력
for item in ai_news_limited:
    print(f"제목: {item['title']}")
    print(f"링크: {item['url']}")
    print(f"출판 날짜: {item['published date']}")
    print(f"설명: {item['description']}")
    print("\n")

이 코드는 max_results=5를 통해 최대 5개의 뉴스만을 수집하도록 제한을 걸었습니다.

3.4 특정 주제에 대한 뉴스 검색

search 옵션을 사용해 특정 주제의 뉴스를 검색할 수 있습니다. 예를 들어, “인공지능 윤리”라는 키워드로 뉴스를 수집하려면 다음과 같이 작성할 수 있습니다.

from gnews import GNews

# GNews 객체 생성
gnews = GNews(language='ko', country='KR')

# '인공지능 윤리' 키워드를 포함한 뉴스 검색
ethics_news = gnews.get_news('인공지능 윤리')

# 결과 출력
for item in ethics_news:
    print(f"제목: {item['title']}")
    print(f"링크: {item['url']}")
    print(f"출판 날짜: {item['published date']}")
    print(f"설명: {item['description']}")
    print("\n")

위 코드는 “인공지능 윤리”라는 특정 주제를 다루는 뉴스만을 검색합니다.

4. GNews로 수집한 뉴스 데이터 활용

수집한 뉴스 데이터를 활용하여 데이터베이스에 저장하거나, 텍스트 분석을 통해 트렌드를 분석하는 등 다양한 방법으로 확장할 수 있습니다. 예를 들어, 수집한 뉴스를 분석해 인공지능 기술의 발전 방향을 추적하거나, 특정 회사와 관련된 뉴스를 모니터링하는 등 여러 가능성을 열 수 있습니다.

결론

GNews 모듈은 언어, 국가, 키워드, 기간, 뉴스 개수 등의 옵션을 통해 맞춤형 뉴스 수집 기능을 제공합니다. 이 글에서는 한국에서 AI 관련 뉴스를 수집하는 방법을 다루었으며, 이를 활용하여 다양한 방식으로 뉴스를 자동 수집하고 분석할 수 있습니다. 앞으로 더 많은 주제와 옵션을 조합해 자신만의 뉴스 수집기를 구축해보세요.

참고자료

태그: , ,

카테고리:

업데이트:

댓글남기기