Code在下面:
Openai whisper超好用第2集---Google Colab python cuda語音辨識程式產生字幕檔,
用過其他語音辨識軟體的,比較openai-whisper,就知道實在太強了。最近補上影片字幕就是是用openai-whisper產生的,語音辨識錯誤率低沒有用到多少工人智慧。這個絕招老師不藏私!!!老師也試用替德語影片上德文字幕,效果也非常好,中文字幕就用chatGPT翻譯。這種AI應用功能強大到讓人皮皮挫!!!
[電影丈量世界Vermessung der Welt神童高斯解答片段]https://youtu.be/zQRzKmPxUQo
[openai-whisper超好用[第一集]---簡介與python pytube語音前置處理]https://youtu.be/sunkO4vCmsQ
[100%C++ 解答LeetCode 122 Best Time to Buy and Sell Stock 2]https://youtu.be/sJd7Q0HyyRg
「openai dall-e python ai修圖」https://youtu.be/H843f1MY_gc
「opencv使用setMouseCallback, circle塗鴉」https://www.youtube.com/watch?v=H_Wj6DoHJ3A
「python撰寫使用openai api DALL-E產生黑柴AI假圖」https://youtu.be/R2ufTfQR348
「與chatGPT對話python的字典dict並解LeetCode 1 Two sum」https://youtu.be/L5Y0GiL78ro
[chatGPT, openai etc清單]
https://www.youtube.com/watch?v=HH4TZnRynPE&list=PLYRlUBnWnd5Lnk06l6O65NUQw7jIJo-Oe&index=1
================================
要先安裝 openai-whisper,上傳聲音檔
開始下載model檔,然後辨識
- print('第一步就是要先切到GPU加速->連線->變更執行階段類型')
- !nvidia-smi
- !pip install -U openai-whisper
- !ls
- from google.colab import files
- uploaded = files.upload()
- for fn in uploaded.keys():
- print('User uploaded file "{name}" with length {length} bytes'.format(
- name=fn, length=len(uploaded[fn])))
- x=fn
- x
產生字幕檔
- import whisper
- model=whisper.load_model('large-v2')
- result=model.transcribe(x)
- result['text']
- #result
- for key, value in result.items():
- print(key, ':', value)
- from whisper.utils import get_writer
- w=get_writer('srt','.')
- w(result,'L.srt')
- files.download('L.srt')
- !cat L.srt
沒有留言:
張貼留言