1樓:
我說一個辦法 不知道可不可以啊 因為我也不怎麼懂 o(∩_∩)o... 我想把word文字複製到「文字文件」應該是txt的 然後再「另存為」 我是用的是vista系統在「另存為」裡會出現一個編碼的選項 裡面就有unicode 然後選它就好了,我不知道其他的系統可不可以用,我是這麼弄得 呵呵o(∩_∩)o... 下面的東西是我copy別人的你可以看看,但好像不怎麼解決問題o(∩_∩)o...unicode格式的最初目標。是用1個16位的編碼來為超過65000字元提供對映。但這還不夠。
它不能覆蓋全部歷史上的文字。也不能解決傳輸的問題(implantation¤ead-ache's)。尤其在那些基於網路的應用中。
因此。unicode用一些基本的保留字元制定了三套編碼方式。它們分別是utf-85195utf-16和utf-32517正如名字所示。
在utf-8中。字元是以8位序列來編碼的739用一個或幾個位元組來表示一個字元。這種方式的最大好處。
是utf-8保留了ascii字元的編碼做為它的一部分。例如。在utf-8和ascii中。
「a」的編碼都是0x41.utf-16和utf-32分別是unicode的16位和32位編碼方式。考慮到最初的目的。通常說的unicode就是指utf-16。
其實 我也不怎麼懂 等我弄懂了告訴你唄 可能到那時候 早就有答案了 o(∩_∩)o...哈哈
python \u559c\u6b22\u4e00\u4e2a\u4eba 怎麼將這樣的字串轉換成unicode的型別?
2樓:
1、定義一個字串man,並列印該字串結果值。
2、宣告一個變數stu並賦值20,利用str()函式將stu轉換成字串並賦值sv,使用type()函式檢視sv的資料型別,並列印sv結果。
3、宣告一個變數bo賦值為true,利用type函式檢視bo的資料型別,再使用str()函式將bo轉換成字串並賦值給sbo,檢視sbo資料型別。
4、宣告一個列表並檢視資料型別,利用str()函式將其轉換成字串,然後檢視資料型別並列印。
5、宣告一個元組並檢視資料型別,然後轉換成字串型別,再次檢視資料型別並列印。
6、宣告一個字典變數,檢視資料型別,利用str()函式將其轉換成字串型別,再次檢視資料型別並列印結果。
3樓:匿名使用者
這本來就是unicode編碼 前面加一個u再列印就可以了
print u'\u559c\u6b22\u4e00\u4e2a\u4eba'
什麼是unicode編碼?
4樓:
unicode碼擴充套件自ascii字元集。在嚴格的ascii中,每個字元用7位元表示,或者電腦上普遍使用的每字元有8位元寬;而unicode使用全16位元字元集。這使得unicode能夠表示世界上所有的書寫語言中可能用於電腦通訊的字元、象形文字和其他符號。
unicode最初打算作為ascii的補充,可能的話,最終將代替它。考慮到ascii是電腦中最具支配地位的標準,所以這的確是一個很高的目標。
unicode影響到了電腦工業的每個部分,但也許會對作業系統和程式設計語言的影響最大。從這方面來看,我們已經上路了。windows nt從底層支援unicode。
目前計算機中用得最廣泛的字符集及其編碼,是由美國國家標準局(ansi)制定的ascii碼(american standard code for information interchange,美國標準資訊交換碼),它已被國際標準化組織(iso)定為國際標準,稱為iso 646標準。適用於所有拉丁文字字母,ascii碼有7位碼和8位碼兩種形式。
unicode只有一個字符集,中、日、韓的三種文字佔用了unicode中0x3000到0x9fff的部分 unicode目前普遍採用的是ucs-2,它用兩個位元組來編碼一個字元, 比如漢字"經"的編碼是0x7ecf,注意字元編碼一般用十六進位制來 表示,為了與十進位制區分,十六進位制以0x開頭,0x7ecf轉換成十進位制 就是32463,ucs-2用兩個位元組來編碼字元,兩個位元組就是16位二進位制, 2的16次方等於65536,所以ucs-2最多能編碼65536個字元。 編碼從0到127的字元與ascii編碼的字元一樣,比如字母"a"的unicode 編碼是0x0061,十進位制是97,而"a"的ascii編碼是0x61,十進位制也是97, 對於漢字的編碼,事實上unicode對漢字支援不怎麼好,這也是沒辦法的, 簡體和繁體總共有六七萬個漢字,而ucs-2最多能表示65536個,才六萬 多個,所以unicode只能排除一些幾乎不用的漢字,好在常用的簡體漢字 也不過七千多個,為了能表示所有漢字,unicode也有ucs-4規範,就是用 4個位元組來編碼字元
5樓:
例:http://zhidao.
這段就是
%c9%e8%d6%c3%b9%d8%d7%a2%b7%d6%c0%
正確的URL格式是什麼,正確的URL格式是什麼樣的
協議 使用者名稱 密碼 子域名.域名.頂級域名 埠號 目錄 檔名.檔案字尾?引數 值 標誌 因特網上的可用資源可以用簡單字串來表示,該文件就是描述了這種字串的語法和語義。而這些字串則被稱為 統一資源定位器 url 這篇說明源於全球資訊網全球資訊主動組織 world wide web global i...
入黨自傳格式是什麼,入黨自傳怎麼寫?格式是?內容寫什麼?有例文嗎?
一 標題。居中書寫 自傳 二 主要內容包括 1 本人基本情況 包括姓名 性別 民族 出生年月日 籍貫 家庭出身 本人身份 文化程度 現從事職業及擔任的職務等 1 2 家庭主要成員情況 主要指父母,已參加工作的兄弟姐妹,以及與本人長期生活在一起的親屬的職業和政治情況。主要社會關係情況 主要指與本人在政...
函的格式是什麼,函的寫作格式是什麼
公函由首部 正文和尾部三部分組成。其各部分的格式 內容和寫法要求如下 一 首部 主要包括標題 主送機關兩個專案內容。1 標題。公函的標題一般有兩種形式。一種是由發文機關名稱 事由和文種構成。另一種是由事由和文種構成。2 主送機關。即受文並辦理來函事項的機關單位,於文首頂格寫明全稱或者規範化簡稱,其後...