掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1296|回复: 5

[讨论] 语音库软件的想法

[复制链接]

该用户从未签到

发表于 2014-10-11 17:05:30 | 显示全部楼层 |阅读模式
首先,抱歉这个贴子与Mdict无关。
3 V" ^; G% k, W8 A/ u' B$ D纯提个建议,希望引起软件大神的注意。
, O9 @, _, p& s9 N# U# G, X如果不符合发贴要求,麻烦版主删除即可。
* q& Z. a& q' {( h8 v2 M
( Y# Y, W& @  b$ T# s2 d去年发过一个帖子《 柯林斯、朗文、牛津、剑桥双解TXT版-【自备语料库】》,很意外受到大家的欢迎。
2 }( c. A9 w4 e当时想的只是利用一些权威词典的例句,做一个庞大的语料库。
" V1 \% b' \( `这只是一定程度上便于提高“读”和“写”的能力。( u1 b! }; P! T; K2 g9 Z+ a) s
7 b+ E! f6 e* x4 Y
现在想立足于“听”和“说”的能力。) x9 S' Q; l! Y! S
5 ^# b& v9 r6 \$ D: o1 b
因为手头上有朗文词典2005的真人例句朗读文件(近10万个例句),同时也获得了国外一个Tatoeba项目12万的真人例句发音。1 A" K# n" E/ i- j, `/ r3 D
这对于练习英语听说是个好材料,可惜缺少一个方便的检索工具。
6 ?1 P( \; z3 M+ V0 x( T$ _
6 B) p( d2 [1 i* F不管是朗文那个也好,还是Tatoeba,下载的音频都是以数字编号命名的MP3文件。文本存在于其他文件下。
$ J: Z* }3 M8 ]. @6 R这样检索起来就有点麻烦。
3 X+ a; \$ ]: }5 A如果我想查找有关school的真人朗读,首先需要查找文本,得到数字编号。再后数字编号去找到相应的音频。- ?3 d5 h+ u; M# K+ T/ F0 x

# F! q' S! L; a) M如果可以将TXT文本与MP3联系起来,在查找某个单词时一步到位,这就方便多了。
" @. D& Q" V& h2 R+ i  N& d: Q" \6 n% n3 x7 o" H
在听说方面,我一直在用一个叫Aboboo的软件。
% Y. v6 {) e& z, N, |它里面有个句库功能,可以依照规定格式批量导入这些音频。倒是可以通过文本搜索,直接查找到相应的音频例句。5 h" i1 p; b& X
但是,它的功能略显简单,不管是查找,还是查找结果的呈现,都不大令我满意。
' g, F0 t, V1 }2 }( b4 M
% Q0 F6 ?5 J5 U/ G# O+ n我希望能有这么一款语音库的软件:& y4 _2 l$ }1 X; e/ b/ [
1、批量导入文本和相应音频。" J) C  J8 B3 w
2、通过检索某个单词,得到所有句子及音频。
1 M9 p2 l7 c/ b4 v3、不需要借助第三方播放器就可以听句子。
1 g! p$ b8 T0 w0 ~8 N& ^; I4、检索方面最好引入正则表达式,以便于更精确搜索。6 ^& o; u# B$ G" E! q+ K9 B* d
5、因为以后还打算通过电影音频及字幕、VOA、EnglisPod、新概念等听力材料制作成更多语音语料,所以最好也可以通过MP3歌词文件LRC直接导入。
4 h7 }6 l4 c) y* h" O" O1 c* c' j5 l" u8 a9 i1 L! l; r& k% \, i7 R
以上是我的一点想法,因为不懂制作软件,一直实现不了。% d; c# l: ?' I7 O9 O! e) @
如果大神有意,可参照Aboboo的相关功能。

该用户从未签到

发表于 2014-10-16 14:52:53 | 显示全部楼层
使用 fastwiki 即可实现这个功能, 详见最新的发布:6 `* ^* ~: U+ K+ W( ]: S7 h8 ~1 a( T
https://www.pdawiki.com/forum/thread-13207-1-1.html

该用户从未签到

 楼主| 发表于 2014-10-17 05:53:20 | 显示全部楼层
fastwiki 发表于 2014-10-16 14:52
% v) n/ u4 Q: F7 }使用 fastwiki 即可实现这个功能, 详见最新的发布:1 q# T& n0 U+ ^# h
https://www.pdawiki.com/forum/thread-13207-1-1.html
' j9 k$ j2 S# m0 S
唉,对我来说,太复杂了,看得一头雾水

该用户从未签到

发表于 2014-10-17 08:05:03 | 显示全部楼层
LYX1692 发表于 2014-10-17 05:53
  v0 v5 I% H3 P1 n. I# e2 L唉,对我来说,太复杂了,看得一头雾水

6 l9 d& c* H$ K* y7 D0 S1. 不会有一款软件直接能满足你说的功能的,
' a: |. q1 S! C3 G# `- qFastwiki 能实现这个功能, 但是需要写上那么几行的 lua 代码./ E3 h% W% x+ n) u
这是因为, 文本格式是有无穷种的, 比如你的文本格式很可能是:
8 R; N7 g0 q: S
5 m; i, T5 q% Q3 q2 _xxx.mp3  一条句子8 o; r/ r; F3 |( |! N% |

! x. Z6 j% h; X* F: P那么别的文本格式很可能又是:  s# f1 _2 A& s1 k
xxx.mp3:- o3 M/ L6 |: B
一条句子6 z* _4 m5 F( k
又一条句子
( f- h& y) ~* }* U, v& R% Z( R7 \
+ n& T1 l9 \! C0 l& l要实现如此多种格式是很困难的.( L3 `+ n+ w. W9 x/ T& Y( p. s
" k) m  G- n2 e+ s
2. fastwiki 已经把大家从编辑器中解放出来了, 大家要做的只是学一下几行 lua,
4 k( u7 J, k$ f- \& y) w; O2 {( u 大家只要相信我, 花上几个小时, 很容易就学会了. 很多时候就在于你相信或不相信,
9 o) P* O' A, g8 |$ e 你相信, 然后去做, 就得到了. 我的 "lua 语言入门" 也是花了一天的时间来写的,. A9 y& [* F7 f
目的就是为了让大家制作任意格式的词典, 也是为了让大家自由发挥.$ f8 j+ G; O4 N3 ~! _

$ D  |" z5 H. ?$ K+ v; q$ M3. 如果你觉得 fastwiki 的工具太复杂了, 也没有看过 https://fastwiki.me/index.php/Howto_learn_lua/zh
* J/ e0 y; E7 ?: H9 c又想实现这个功能的话, 唯一的方法就是把你的 mp3, 以及文本, 和功能要求,
& o6 }' ]! d" p% B 打包共享出来,  才有可能有网友帮你制作.  另外, 可以加入 :
3 H' A  Y2 E$ \" x( J    fastwiki 数据制作 & 使用 qq 群: 173327815
, ~& x, b+ k1 {6 ]2 `- K( B

该用户从未签到

 楼主| 发表于 2014-10-17 15:27:47 | 显示全部楼层
fastwiki 发表于 2014-10-17 08:05
" Q. ^; l4 F7 p' D1. 不会有一款软件直接能满足你说的功能的,  L8 Z( R/ C# {  ^, `. }
Fastwiki 能实现这个功能, 但是需要写上那么几行的 lua 代码 ...
7 l1 x/ V4 J" i, k: l
谢谢,今天静下心来,好好摸索了一下,比明天稍有进步了,知道如何测试lua了。; c5 _7 G5 j* W$ w
但还是碰到许多问题。6 Y6 f4 M; e& Q! D! E  h) E8 k6 N

; ]; J4 l: ]/ K% \; m可否以7个mp3文件来作一个简单说明呢?
- v( L* S+ q7 s
! @# q+ Z0 p6 r" e' I! J语音包我正在上传,以后会共享出来。
0 L3 y) o% `: r2 a
5 A" v1 }# E4 P0 R' a但我还是希望可以自己学到实际的操作方法,因为我只要听英语材料,自建的语音库随时都在增加。
) ^1 V& f9 \5 _0 h: v% A
" p6 [% F( n& D8 thttp://pan.baidu.com/s/1nt7KSyt
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

小黑屋|手机版|Archiver|PDAWIKI |网站地图

GMT+8, 2024-6-8 06:10 , Processed in 0.057984 second(s), 10 queries , MemCache On.

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表