在這篇文章中,我們將討論 Golang 中的字符串,并查看一些不同的場景,以避免常見錯誤。讓我們深入探討!
我們已經對 Golang 中的字符串有了基本的了解,但我們可以從 Golang 字符串不能為 nil 開始,除非您使用指向字符串的指針。
如下代碼所示,當我們創建一個字符串變量時,默認值必須是空的""。如果我們用 nil 值初始化字符串變量,我們將面臨在變量聲明中不能使用 nil 作為字符串值的錯誤。例如:
func main() { var s string s = nil // Cannot use 'nil' as the type string fmt.Println(s)}
編譯器會提示我們不能使用 nil 賦予 string 類型。因此,我們可以只是定義變量,或者使用""作為默認值:
func main() { var s string var ss = "" fmt.Println(s, ss)}
如果我們堅持在字符串類型變量中使用 nil 值,則應使用指針,如下所示:
func main() { var s *string fmt.Println(s)}
這個時候輸出則為:
<nil>
但是,我們必須謹慎使用這種方法。每次要為變量賦值時,我們都必須編寫更多的代碼,而且在賦新值之前還要檢查是否有零值或前一個值。
func main() { var s *string tmp := "hello" s = &tmp fmt.Printf("address: %+v, value: %s", s, *s)}
這個時候打印出來 s 的地址以及所指向的值:
address: 0xc00008a030, value: hello
Golang 中的字符串是不可變的,這意味著我們不能更改每個字符的值。例如:
func main() { tmp := "hello" tmp[0] = 'J' fmt.Println(tmp)}
上述代碼會導致編譯時錯誤,因為無法賦值給 tmp[0]。
更改字符串中單個字符的常見錯誤如下:
func main() { tmp := "hello" tbs := []byte(tmp) tbs[0] = 'J' fmt.Println(string(tbs)) chi := "你好" chiTBS := []byte(chi) chiTBS[0] = 'J' fmt.Println(string(chiTBS))}
輸出為:
JelloJ??好
雖然第一個輸出顯示的結果符合我們的預期,但這并不是更改某個字符的正確方法。
這是因為我們打算修改的單個部分可能存儲在多個字節中,即使你想將變量轉換為符文類型并更改你想要的部分,我也不得不說,這是不可能做到的,因為它可能被放置在多個符文中,我們需要謹慎行事!
在 Golang 中,字符串由字節(字節的片段)組成,某些字符需要存儲在多個字節中,例如:"?"。
因此,當需要確定一個字符串類型變量的長度時,我們必須謹慎編碼。例如:
func main() { tmp := "¥" fmt.Println("bytes: ", len(tmp)) fmt.Println("runes: ", utf8.RuneCountInString(tmp))}
len 函數返回的是字符串的字節數,而不是字符數。當我們需要找出字符串的符文數時,可以使用 uft8.RuneCountIntString() 函數。
另一個常見的誤解是使用 uft8.RuneCountIntString() 來確定字符數,但這并不是在任何情況下都正確,因為一個字符串變量可能跨越多個符文。請看這個例子:
func main() { tmp := "??" fmt.Println("bytes: ", len(tmp)) fmt.Println("runes: ", utf8.RuneCountInString(tmp))}
輸出為:
bytes: 6runes: 2
在 Golang 中,使用索引檢索字符串的單個部分將為我們提供字符的 uint 值,并且只能檢索第一個字節。但在字符串變量的 for 循環中,我們可以訪問每個字符的符值:
func main() { tmp := "?¥%……&*" fmt.Printf("char at 0 index, has type %T and value is %+v/n", tmp[0], tmp[0]) for _, t := range tmp { fmt.Printf("value is %+v type is %T/n", t, t) }}
輸出:
char at 0 index, has type uint8 and value is 226value is 10084 type is int32value is 65509 type is int32value is 37 type is int32value is 8230 type is int32value is 8230 type is int32value is 38 type is int32value is 42 type is int32
在對字符串進行迭代時,還要注意變量中可能存在的非 UTF8 字符,如果 Golang 無法將其理解為 UTF8,則會使用 unicode 替換而非實際值。
在 Golang 中,我們總是可以使用 == 來檢查簡單的字符串是否相等,但如果我們的變量存在隱藏點,則應在比較兩個字符串變量之前使用 unicode 規范包將其規范化:
func main() { cafe1 := "Café" cafe2 := "Cafe/u0301" normalizeCafe1 := norm.NFC.String(cafe1) normalizeCafe2 := norm.NFC.String(cafe2) fmt.Println(cafe1 == cafe2) fmt.Println(normalizeCafe1 == normalizeCafe2)}
使用“+”連接大量字符串的效率可能非常低。使用 strings.Builder 是高效構建字符串的最佳方法之一:
func main() { sb := strings.Builder{} for i := 0; i < 1000; i++ { sb.WriteString("hello ") } result := sb.String() fmt.Println(result)}
與傳統的 + 連接方法相比,這種方法速度更快,內存消耗更少,而且可以避免創建不必要的中間字符串。我們還可以使用 bytes.Buffer 軟件包來實現這一目標。
本文鏈接:http://www.tebozhan.com/showinfo-26-15187-0.htmlGolang 中的字符串:常見錯誤和優秀實踐
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: Golang中的錯誤處理:全面指南及示例