題 將ascii俄語轉換為俄語?


我有一個文本文件,應該用俄語寫,但它似乎是ascii:

Óñòàíîâêà:
1)Çàïóñêàåì QuidamStudioSetup3.15.exe
2)Ïðè çàïðîñå ñåðèéíîãî íîìåðà ââîäèì

我怎麼能把它轉換成可讀的unicode俄語字符?


4
2017-10-06 20:30


起源


在MS Word中打開文件。它可以在大多數時間正確猜測編碼 - phuclv


答案:


它是  “ASCII”也不是“ASCII俄語”。

在Unicode普及之前,大多數計算機系統使用ISO-8859字符編碼,其中有16個,每個編碼系統用於不同的區域(中歐,西里爾,希臘語......)。 Windows有自己的“代碼頁”,非常相似,但在其他未使用的範圍內有額外的字形。所有這些字符編碼都是8位,只在後半部分(128-255)有所不同。

這些編碼的問題在於程序幾乎不可能確定 哪一個 編碼用於保存文件,除非明確指定(例如在HTML頁面中;但是,純文本文件沒有這樣的元數據標籤)。閱讀維基百科上的文章 變為亂碼 有關更詳細的說明。

在您的示例中,文檔已使用保存 Windows的1251 (西里爾文),但是你的程序就像是一樣 Windows的1252 (西歐),在同一職位上有不同的角色。對於計算機來說,它看起來完全沒問題 - 它不懂語言或腳本。 (有些程序會進行統計分析,以確定正確的編碼,但有些網絡瀏覽器具有這樣的功能。)

有幾種方法可以將此類文本轉換為Unicode:

  • 使用 在線工具如 這個 要么 這個

  • 使用您的網絡瀏覽器:

    1. 拖動 .txt 文件進入瀏覽器。

    2. 查看→字符編碼 (要么 Firefox→Web開發人員→字符編碼, 要么 扳手→工具→編碼),選擇正確的原始編碼:“西里爾文(Windows-1251)”在你的情況下。

  • 使用 的Notepad2 文本編輯器:

    1. 打開文件。

    2. 文件→編碼→重新編碼...,選擇正確的原始編碼。

  • 使用GNU iconv,Windows二進製文件來自 的GnuWin32 要么 Win32的Gettext

    iconv -f CP1251 -t utf-8 < myfile.txt文件 > myfile.fixed.txt

    Windows記事本將正確讀取UTF-8和UTF-16編碼的文本。


9
2017-10-06 21:13





您可以使用諸如的程序轉換編碼 的iconv  - 但是你需要知道使用了什麼編碼。

根據a似乎是Windows-1251 隨機網頁 由Google發現。

Установка:
  1)ЗапускаемQuidamStudioSetup3.15.exe
  2)Призапросесерийногономеравводим

我不知道俄語,但將其粘貼到translate.google.com中表明上述內容似乎是合理的:

安裝:
  1)運行QuidamStudioSetup3.15.exe
  2)出現提示時,輸入序列號

所以......

iconv -f 1252 -t UTF-8 document.txt

應該將您的測試文件轉換為可以在記事本中打開和讀取的內容


3
2017-10-06 21:10



我知道俄語,你說得對,它是Windows-1251。 - haimg