왜 2025년에 AI 딕테이션이 갑자기 쓸 만해졌나
예전 음성 인식 앱은 발음이 또렷한 특정 악센트에만 잘 작동하고, 속도도 느리고, 띄어쓰기·맞춤법·문장부호까지 전부 손으로 고쳐야 하는 수준이었습니다. 2025년에는 LLM(대형 언어 모델) + 최신 음성 인식(S2T)가 결합되면서, 다음이 크게 좋아졌습니다.
- 문맥을 이해하고 자동으로 문장부호·개행·형식을 잡아 줌
- “어.. 음.. 그러니까” 같은 군더더기·실수 표현 자동 제거
- 사용자가 원하는 톤(포멀/캐주얼)에 맞춰 글을 다듬어 줌
결과적으로, “처음 초안을 말로 뽑고, 최소한만 수정해서 바로 쓰는” 흐름이 현실적인 수준에 올라왔습니다.
Wispr Flow: 스타일 설정·커스텀 단어에 강한 메이저 플레이어
핵심 특징
- 잘 자금 조달된(VC가 꽤 들어온) AI 딕테이션 앱
- Mac, Windows, iOS용 네이티브 앱 지원, 안드로이드는 개발 중
- 스타일 프리셋: formal / casual / very casual 옵션으로, 메신저·업무 문서·이메일 등 글 종류에 맞춰 자동 톤 조정
- 커스텀 단어·지시어 등록: 전문용어·브랜드명·이름 등을 사전에 학습시켜 오인식을 줄임
- Cursor 같은 AI 코드 에디터와 함께 쓰면 변수·파일명 인식 기능도 제공
요금·무료 분량
- 데스크톱: 월 최대 2,000단어 무료
- iOS: 월 1,000단어 무료
- 유료: 월 15달러부터, 무제한 전사 제공
→ 한국어·영어 혼용 작업이 잦고, 톤까지 자동 정리해 주길 원하는 크리에이터·직장인에게 특히 유용합니다.
Willow: 프라이버시 중시 + ‘한두 문장으로 긴 글 뻥튀기’
핵심 특징
- “타이핑을 싫어하는 사람을 위한 타임 세이버”를 표방
- 기본적인 자동 편집·포맷팅 외에,
- 몇 단어만 말해도 LLM이 나머지 문장을 길게 펼쳐 쓰는 기능 제공
- 프라이버시 지향:
- 모든 전사를 기기 로컬에 저장
- 모델 학습 opt-out 가능 (내 데이터가 회사 모델 훈련에 쓰이지 않게 설정)
- 커스텀 어휘 추가로 업계 용어·사투리 적응력 향상
요금·무료 분량
- 데스크톱: 월 2,000단어 무료
- 유료: 월 15달러부터, 무제한 딕테이션 + 글쓰기 스타일 기억 기능
→ 데이터가 클라우드에 가는 게 싫고, 짧게 말해도 길고 매끈한 문장을 뽑고 싶은 사용자에게 맞는 선택입니다.
Monologue: 완전 로컬 모델 + 톤 커스터마이징 + ‘Monokey’ 굿즈
핵심 특징
- 모델을 통째로 내려 받아 기기 내에서만 돌릴 수 있는 프라이버시 최우선 앱
- 음성 데이터가 클라우드로 안 나가길 원하는 유저에게 적합
- 사용하는 앱에 따라 톤(voice)을 다르게 설정 가능
- 예: 슬랙에서는 캐주얼, 이메일 앱에서는 포멀하게 등
- 헤비 유저에게는 Monokey라는 전용 하드웨어 키를 보내주는 이벤트도 진행 (한 개 키로 push-to-talk 전사)
요금·무료 분량
- 월 1,000단어 무료
- 구독: 월 10달러, 연 100달러
→ 개발자·기밀 프로젝트·민감한 인터뷰 등, “클라우드 업로드를 아예 피하고 싶다”는 상황에서 마이크로폰처럼 써먹기 좋은 구성입니다.
Superwhisper: 음성·오디오·영상까지, 모델도 직접 골라 쓰는 고급형
핵심 특징
- 기본은 딕테이션 앱이지만,
- 외부 오디오·비디오 파일 업로드 → 전사도 지원
- 사용자가 모델을 직접 선택·다운로드 가능
- 자체 모델들 (속도·정확도 차등)
- 엔비디아의 Parakeet 음성 인식 모델까지 선택 가능
- 커스텀 프롬프트로 출력 스타일을 세밀하게 제어
- 가공 전 원본 전사와, 필터링·포맷팅된 전사를 나란히 확인 가능
- 시스템 키보드와 통합되어, 입력창 어디서나 바로 사용 가능
요금·무료 분량
- 기본 음성→텍스트는 무료
- Pro 기능(번역·파일 전사 등)은 15분 무료 체험 제공
- 유료 플랜에서 자신의 AI API 키 사용, 클라우드/로컬 모델을 제한 없이 붙일 수 있음
- 가격: 월 8.49달러, 연 84.99달러, 또는 249.99달러 평생 이용권
→ 팟캐스트·유튜브·인터뷰 전사처럼 파일 베이스 작업이 많고, 다양한 모델을 바꿔 쓰면서 품질·속도를 튜닝하고 싶은 파워 유저에게 적합합니다.
VoiceTypr: 완전 오프라인·무구독·한 번 사서 쓰는 평생 라이선스
핵심 특징
- 오프라인 우선(offline-first) 철학
- 로컬 모델로 전사를 돌려, 클라우드 의존도를 최소화
- 오픈소스 버전을 직접 띄우고 싶은 사람을 위해 GitHub 저장소도 제공
- 99개 이상 언어 지원, Mac·Windows 모두 지원
요금 구조
- 3일 무료 체험 후, 완전 평생 라이선스 일시불 구매
- 1대: 35달러
- 2대: 56달러
- 4대: 98달러
→ 구독이 싫고, “그냥 한 번 사고 오래 쓰는 오프라인 도구”를 원하는 사용자에게 매력적인 옵션입니다.
Aqua: 음성으로 ‘내 주소’만 말해도 전체 자동 입력
핵심 특징
- 윈도우·맥용, YC 출신 저지연(latency) 특화 음성 타이핑 클라이언트
- 기본적인 문법·구두점 정리 외에,
- “my address”라고 말하면 미리 저장된 주소 전체를 자동 입력하는 식의 오토필 기능 제공
- 비밀번호 힌트, 회사 정보, 반복되는 한 줄 소개 등도 매핑 가능
- 자체 Speech-to-Text API를 다른 앱에 제공해, 개발자들이 붙여 쓸 수 있게 함
요금·무료 분량
- 월 1,000단어 무료
- 유료 플랜: 월 8달러부터(연간 결제 기준)
- 무제한 단어 + 800개 커스텀 사전 값 등록 가능
→ 템플릿성 문구·주소·계좌정보·회사 소개 등을 말 한마디로 자동 완성하고 싶은 세일즈·CS·프리랜서에게 특히 유용합니다.
Handy & Typeless: 무료·고용량이 필요하다면
Handy: 완전 무료·오픈소스 입문용
- Mac·Windows·Linux에서 돌아가는 오픈소스·무료 전사 툴
- 기능은 기본적이지만,
- push-to-talk 토글
- 단축키 변경 정도의 설정을 지원
- “유료 구독은 싫은데 음성 입력을 한 번 써보고 싶다”는 사람에게 적합한 가벼운 입문용 옵션입니다.
Typeless: 높은 무료 할당량 + 프라이버시 약속
- Windows·Mac 용 딕테이션 앱으로,
- 회사 측은 데이터를 저장하거나 모델 학습에 사용하지 않는다고 밝힘
- 사용자가 말하다 문장을 꼬아도, 더 나은 문장 후보를 제안해 줍니다.
- 무료 플랜: 주당 4,000단어, 월로 환산하면 약 1만6,000단어 수준
- 유료: 월 12달러(연 결제 기준)에 무제한 단어 + 신기능 우선 제공
→ 글을 많이 말로 쓰지만 비용을 억제하고 싶은 사람, 무료 할당량이 넉넉해야 하는 학생·크리에이터에게 좋습니다.

