編碼與解碼-創(chuàng)新互聯(lián)

1.字符編碼
編碼與解碼
ascii碼(不能直接寫字符,漢字從而引入了GBK碼)
GB2312 收錄了7445個漢字及字符;
GBK1.0 收錄了21886個漢字及字符;
GB18030 收錄了27484個漢字及字符;
unicode 國際標準但都需要倆個字節(jié);
utf-8 是優(yōu)化的國際化的統(tǒng)一標準,(是可變長的字符集)英文及其字符用1byte表示,而漢字要用3bite表示;

創(chuàng)新互聯(lián)長期為1000+客戶提供的網(wǎng)站建設服務,團隊從業(yè)經(jīng)驗10年,關注不同地域、不同群體,并針對不同對象提供差異化的產(chǎn)品和服務;打造開放共贏平臺,與合作伙伴共同營造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為佛山企業(yè)提供專業(yè)的成都網(wǎng)站制作、網(wǎng)站建設,佛山網(wǎng)站改版等技術服務。擁有10多年豐富建站經(jīng)驗和眾多成功案例,為您定制開發(fā)。

2 .代碼中的體現(xiàn)

res1='你好'
res2='hello'

print(res1.encode('utf-8') ,type(res1.encode('utf-8')))   # b'**\xe4\xbd\xa0**\xe5\xa5\xbd'  bytes類型
print(res2.encode('utf-8'))         # b'hello'

print(res1.encode('gbk'),type(res1.encode('gbk')))   # b'**\xc4\xe3**\xba\xc3'                bytes類型
print(res2.encode('gbk'))        # b'hello'

能夠發(fā)現(xiàn)英文在gbk與utf-8的編碼下是不發(fā)生變換的;而漢字在gbk的編碼下是2字節(jié),而在utf-8的編碼下是3字節(jié),類型是bytes類型

ret1=b'\xe4\xbd\xa0\xe5\xa5\xbd'
print(ret1.decode('utf-8'))
print(ret1.decode('gbk'))      #  會出現(xiàn)亂碼 浣犲ソ

能夠發(fā)現(xiàn)utf-8編碼下的bytes類型,由gbk解碼能夠解碼但出現(xiàn)了亂碼,因為gbk每2個字節(jié)解碼一次

ret2=b'\xc4\xe3\xba\xc3'
print(ret2.decode('gbk'))     #  能夠解碼為    你好

print(ret2.decode('utf-8'))
#  報錯的類型:  UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc4 in position 0: invalid continuation byte
能夠發(fā)現(xiàn)utf-8編碼下的bytes類型,由gbk解碼能夠解碼但出現(xiàn)了亂碼,因為gbk每2個字節(jié)解碼一次

3.實際中遇到的問題(模擬黏包問題)`

server端:

import socket

sk=socket.socket()
sk.bind(('127.0.0.1',8091))
sk.setsockopt(socket.SOL_SOCKET,socket.SO_REUSEADDR,1)

sk.listen()
conn,addre=sk.accept()

while True:
    cmd=input('>>>')
    if cmd=='Q':
        conn.send(cmd.encode('utf-8'))
        break
    conn.send(cmd.encode('utf-8'))
    res=conn.recv(1024)
    print(res.decode('utf-8'))
conn.close()

sk.close()

client端:

import socket
import subprocess

sk=socket.socket()

sk.connect(('127.0.0.1',8091))

while True:
    cmd=sk.recv(1024).decode('utf-8')
    if cmd=='Q':
        break
    res=subprocess.Popen(cmd,shell=True,stdout=subprocess.PIPE,stderr=subprocess.PIPE)  # stdout;stderr拿到的數(shù)據(jù)就是bytes類型
    stdout='stdout:'+res.stdout.read().**decode('gbk')**     # 這里的解碼只能是gbk,因為它的編碼形式就是gbk
    stderr = 'stderr:' + res.stderr.read()**.decode('gbk')**  
    sk.send(bytes(stdout,encoding='utf-8'))
    sk.send(bytes(stderr,encoding='utf-8'))

sk.close()

4.個注意的問題:
1.socket,send('數(shù)據(jù)類型只能是bytes,傳碼之前一定要編碼');
2.str+ bytes是不能拼接的,只有將bytes類型解碼成str才能拼接;

(能力有限,多多指教^-^)

另外有需要云服務器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務器、裸金屬服務器、高防服務器、香港服務器、美國服務器、虛擬主機、免備案服務器”等云主機租用服務以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應用場景需求。

網(wǎng)頁名稱:編碼與解碼-創(chuàng)新互聯(lián)
鏈接URL:http://bm7419.com/article2/cecjic.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站維護、響應式網(wǎng)站、網(wǎng)站導航、全網(wǎng)營銷推廣、App設計、搜索引擎優(yōu)化

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

營銷型網(wǎng)站建設