最近做了一個(gè)小項(xiàng)目,遇到此類問(wèn)題,記錄一下,也算是一個(gè)總結(jié)。
此項(xiàng)目分為兩部分,一個(gè)是新聞數(shù)據(jù)采集,一個(gè)是采集信息的審核,最后生成XML文件。
數(shù)據(jù)采集后的數(shù)據(jù)經(jīng)過(guò)用戶編輯完之后,要導(dǎo)出一個(gè)ACCESS文件,然后把這個(gè)文件導(dǎo)入到信息審核系統(tǒng)。在ACCESS庫(kù)中存儲(chǔ)新聞信息的字段類型是ntext類型,而審核系統(tǒng)庫(kù)中對(duì)應(yīng)的是varchar(max)類型的字段,導(dǎo)入之后,發(fā)現(xiàn)有的空白字符會(huì)出現(xiàn)亂碼,表現(xiàn)為問(wèn)號(hào)(?),其實(shí)經(jīng)過(guò)后面的測(cè)試,這不是空白(空格)字符,而一個(gè)特殊字符,怎么辦?經(jīng)過(guò)幾番測(cè)試后發(fā)現(xiàn),varchar(max)類型要改成nvarchar(max)類型,這樣導(dǎo)入的數(shù)據(jù)就不會(huì)再有此類問(wèn)題了。
但后面的測(cè)試過(guò)程中,又會(huì)發(fā)現(xiàn)對(duì)導(dǎo)入后的采集信息更改(通過(guò).net程序編輯功能)后,數(shù)據(jù)庫(kù)中此條信息又出現(xiàn)了亂碼問(wèn)題,研究后發(fā)現(xiàn)在插入語(yǔ)句中這樣寫就不會(huì)出現(xiàn)此類問(wèn)題了,如insert into 表名 (news)values(N'"+更新后的值+""),為什么加N?去百度一下就明白了。
到此,心中總算得到安慰,但后面的問(wèn)題又讓人陷入郁悶之中。。。。。。
審核完的信息要生成XML類型的文件,并且XML要采用GB2312編碼,因?yàn)椴杉男侣劸W(wǎng)站,有很多網(wǎng)站采用的是UTF8編碼,這樣在轉(zhuǎn)化的過(guò)程中又出現(xiàn)亂碼(還是那個(gè)“空白”特殊字符搞的),怎么辦?網(wǎng)上介紹的把UTF8轉(zhuǎn)化成GB2312就可以了,但實(shí)際發(fā)現(xiàn),還是解決不了問(wèn)題,這下弄的一上午為了解決這個(gè)問(wèn)題,最后還是沒(méi)有辦法,正郁悶之時(shí),突然想到通過(guò)VS的調(diào)試功能來(lái)看看這個(gè)特殊字符究竟是什么玩意,最后通過(guò)把數(shù)據(jù)庫(kù)的此字段值讀取出來(lái)之后,然后轉(zhuǎn)化成字符數(shù)組,content.ToCharArray(); 一個(gè)一個(gè)的看,發(fā)現(xiàn),導(dǎo)致亂碼的這個(gè)字符是' '注意引號(hào)中的空白,這不是一個(gè)空格,而是一個(gè)在GB2312中無(wú)法識(shí)別的特殊字符,此時(shí)突然想到,能不能把這個(gè)字符的值直接用空格替換呢?馬上行動(dòng),果然,解決了亂碼問(wèn)題。真求郁悶,這一個(gè)毛玩意浪費(fèi)了一半天時(shí)間。
注意,必須要用調(diào)試出來(lái)的這個(gè)值(因?yàn)檫@才是真正的導(dǎo)致亂碼的那個(gè)特殊字符),調(diào)試的時(shí)候在即使窗體中粘貼。
代碼如下:
content = content.Replace(" ", " ");
更多信息請(qǐng)查看IT技術(shù)專欄