題 中等大小的英語單詞列表


我正在嘗試編寫一個帶有拼寫檢查/自動完成功能的程序。為此我需要一個相當大的最常用英語單詞列表。我遇到的問題是,我發現列表大小存在很大差異。他們要么<1,000字還是> 50,000。 <1,000個單詞的列表太短,省略了許多有用的單詞。但是,對於我的算法(速度方面),> 50,000個單詞的列表開始變得有點多了。

任何人都知道列表~3,000-12,000個英文單詞。最好是.txt文件。此外,它需要具有相對非限制性的許可(即可再分發)。


3
2018-06-01 23:32


起源


有關: superuser.com/questions/120699/word-list-sources - sblair


答案:


嘗試 維基詞典中最常見的英文單詞列表。隨心所欲地盡可能少!


4
2018-06-02 00:08



就是我想要的那種東西! - RectangleTangle


http://wordlist.sourceforge.net/ 有一個單詞列表。我通常會想像添加更多單詞根本不會是計算密集型的(因為它最糟糕的是單詞列表的比較長度,如果你使用字典或其他一些優化的數據結構,它可能會更快)。


2
2018-06-02 00:09



我當前的算法完全用Python編寫並使用列表。所以更多的項目,意味著更多的比較。它實際上可以處理多達100,000個井。然而,我需要它即時,即使在低性能機器(即上網本和舊計算機)上。在大約50,000左右,我的上網本開始變形(大約需要0.3秒)。 - RectangleTangle
我認為你做錯了...然後,一個案例開關(26首可能的第一個字母)將大大加快速度。 - soandos


http://www.gnu.org/software/miscfiles/ 有一個文件列表

$ wc -w words extra.words 
  234937 words
  121847 extra.words
  356784 total

數字永遠不會......


0
2018-06-02 06:28