본문 바로가기
  • _^**_
카테고리 없음

파이썬으로 유튜브 동영상 자막 추출하는 방법

by 크리드로얄워터 2023. 12. 19.
반응형

YouTube 동영상의 자막(캡션)을 가져오기 위해 Python을 사용할 수 있습니다.


이를 위해서는 youtube-dl과 같은 외부 라이브러리를 사용할 수 있습니다.

youtube-dl은 비디오 다운로드 뿐만 아니라 자막을 추출하는 기능도 제공합니다.

먼저, youtube-dl 라이브러리를 설치해야 합니다. 이는 Python의 pip를 통해 설치할 수 있습니다:

pip install youtube-dl

그 후, 아래의 Python 코드를 사용하여 특정 YouTube 비디오의 자막을 가져올 수 있습니다:

import youtube_dl

def download_captions(video_url):
    ydl_opts = {
        'skip_download': True,
        'writesubtitles': True,
        'subtitleslangs': ['en'],  # 자막 언어를 영어로 설정 (필요에 따라 변경 가능)
        'outtmpl': 'captions',  # 출력 파일명
        'quiet': True,
    }

    with youtube_dl.YoutubeDL(ydl_opts) as ydl:
        ydl.download([video_url])

# YouTube 비디오 URL을 여기에 입력
video_url = 'https://www.youtube.com/watch?v=YOUR_VIDEO_ID'
download_captions(video_url)

이 코드는 지정된 YouTube 비디오의 자막을 다운로드합니다. 자막 언어는 subtitleslangs 옵션에서 설정할 수 있습니다.

중요한 점: 이 방법은 해당 YouTube 동영상이 자막을 제공하고, 그 자막이 공개적으로 접근 가능할 때만 작동합니다. 또한, YouTube의 정책이나 youtube-dl 라이브러리의 상태에 따라 이 기능이 변경되거나 작동하지 않을 수 있습니다.


반응형

댓글