20240121 업데이트
config
에 is_share
추가, Colab 등의 환경에서 이를 True
로 설정하여 webui를 공용 네트워크에 매핑되도록 할 수 있습니다.
- WebUI에 영어 번역이 추가되었습니다.
cmd-asr
은 damo 모델이 이미 포함되어 있는지 자동으로 확인하고, 기본 경로에 없는 경우 modelscope에서 자동 다운로드 되도록 수정하였습니다.
- SoVITS 학습 중 ZeroDivisionError가 발생하는 경우 복구를 시도합니다. (길이가 0인 샘플 필터링 등)
- TEMP 파일 폴더에서 오디오 및 기타 파일을 정리하여 최적화합니다.
- 합성 오디오가 레퍼런스 오디오의 끝부분을 포함하는 문제를 개선하였습니다.
20240122 업데이트
- 너무 짧은 출력 파일이 중복된 레퍼런스 오디오를 반환하는 문제 수정하였습니다.
- 영어-일본어 학습이 원활하게 진행되는 QA를 완료하였습니다. (다만, 일본어 학습은 루트 디렉토리에 영어 이외의 문자가 없어야 합니다)
- 오디오 경로를 검사합니다. 잘못된 경로를 읽으려고 할 때 '경로가 존재하지 않습니다'라는 에러 메시지를 반환하도록 수정하였습니다. 이는 ffmpeg 모듈의 에러가 아닙니다.
20240123 업데이트
- hubert에서 nan 추출로 인한 SoVITS/GPT 학습 중 ZeroDivisionError 관련 에러를 해결하였습니다.
- 추론 인터페이스에서 모델을 빠르게 전환할 수 있도록 지원하도록 수정되었습니다.
- 모델 파일 정렬 로직 최적화하였습니다.
- 중문 분석에
jieba_fast
를 jieba
로 대체하였습니다.
20240126 업데이트
- 중국어와 영어, 일본어와 영어가 혼합된 출력 텍스트를 지원합니다.
- 출력에서 선택적 분할 모드를 지원합니다.
- uvr5가 디렉토리를 읽고 자동으로 종료되는 문제를 수정하였습니다.
- 여러 줄바꿈으로 인한 추론 오류를 수정하였습니다.
- 추론 인터페이스에서 불필요한 로그 제거하였습니다.
- MacOS에서의 학습 및 추론을 지원합니다.
- 반정밀을 지원하지 않는 카드를 자동으로 식별하여 단일 정밀도를 강제 적용하고, CPU 추론에서 단일 정밀도를 강제 적용합니다.
20240128 업데이트
- 숫자를 한자로 읽는 문제를 수정했습니다.
- 문장 시작 부분의 일부 단어가 누락되는 문제 수정하였습니다.
- 부적절한 길이의 레퍼런스 오디오를 제한하였습니다.
- GPT 학습 시 ckpt가 저장되지 않는 문제 수정하였습니다.
- Dockerfile에서 모델 다운로드 프로세스 개선하였습니다.
20240129 업데이트
- 반정밀도 훈련에 문제가 있는 16 시리즈 및 기타 그래픽 카드의 훈련 구성을 단정밀도 훈련으로 변경했습니다.
- Colab에서도 사용이 가능한 버전을 테스트 및 업데이트 하였습니다.
git clone modelscope funasr
저장소와 오래된 버전의 funasr 사용으로 인해 인터페이스가 일치하지 않는 오류를 수정하였습니다.
20240130 업데이트
- 경로와 관련된 문자열을 파싱하여 큰따옴표를 자동으로 제거합니다. 또한, 경로를 복사하는 경우 큰따옴표가 포함되어도 오류가 발생하지 않습니다.
- 중국어 및 영어 문자열의 문장 부호가 잘리는 문제 및 문장의 시작과 끝에 문장 부호가 추가되는 문제를 수정했습니다.
- 문장 부호의 수를 확장하였습니다.
todolist:
- 동음이의어(중문) 추론 최적화
- 영문 대문자 인식 및 영문 하이픈 문제
- 텍스트에 % 기호가 포함되어 있으면 오류가 발생하며 추론이 불가능합니다. 또한 '元/吨'이 '元吨'으로 읽히지 않고 '元每吨'으로 읽히도록 하는 등의 문제가 존재합니다. 이러한 문제를 해결하기 위해 어떤 라이브러리를 사용해야 하며, 이에 대한 개선을 고민하고 있습니다.
- 중-일-영, 중-영, 일-영을 포함한 다섯 가지 언어를 지원하는 것을 목표로 잡고있습니다.