数据格式

寒江蓑笠翁大约 11 分钟

数据格式

在当前互联网时代中,最常用的独立于语言的数据格式有xmlYamljsonprotobuf,Go同样的也支持这些数据格式的相关的操作,以下为对比表格。

名称XMLYAMLJSONProtocol Buffers
数据结构复杂较简单简单较复杂
保存方式文本文本文本二进制
保存大小
解析效率
语言支持非常多很多较多
开发难度繁琐较简单简单简单
学校成本
适用范围数据交换配置文件数据交换数据交换

提示

在go中,如果想要对结构体进行序列化与反序列化,字段必须是对外暴露的,即首字母大写。

XML

xml又名eXtensible Markup Language,是用于存储数据的一种格式,起源于20世纪60年代,是以上几种数据格式中最为古老的一种。它的用途十分广泛,可用于网络传输,数据交换,配置文件,数据存储等等。但随着时代的更替,逐渐正在被新的标记语言替代。

首先定义结构体

type Person struct {
   UserId   string `xml:"id"`
   Username string `xml:"name"`
   Age      int    `xml:"age"`
   Address  string `xml:"address"`
}
func Marshal(v any) ([]byte, error) //xml序列化

func MarshalIndent(v any, prefix, indent string) ([]byte, error) //格式化

func Unmarshal(data []byte, v any) error //反序列化

序列化

func main() {
   person := Person{
      UserId:   "120",
      Username: "jack",
      Age:      18,
      Address:  "usa",
   }

   bytes, err := xml.MarshalIndent(person, "", "\t")
   if err != nil {
      fmt.Println(err)
      return
   }
   fmt.Println(string(bytes))
}

输出

<Person>                      
        <id>120</id>          
        <name>jack</name>     
        <age>18</age>         
        <address>usa</address>
</Person> 

反序列化

func main() {
   var person = Person{
      UserId:   "",
      Username: "",
      Age:      0,
      Address:  "",
   }

   xmlStr := "<Person>                      \n        <id>120</id>          \n        <name>jack</name>     \n        <age>18</age>         \n        <address>usa</address>\n</Person>  "

   err := xml.Unmarshal([]byte(xmlStr), &person)
   if err != nil {
      fmt.Println(err)
      return
   }
}

输出

{UserId:120 Username:jack Age:18 Address:usa}

不过传统的xml解析方式经常需要新建结构体,这会十分的繁琐,现在解析的都是简单的xml结构,倘若使用复杂的结构,就会让人十分头疼。所以我们大多数会用一个第三方开源库etree来解析xml,感兴趣的可以自行了解:Go比较好用的解析xml文件的插件etree - 掘金 (juejin.cn)open in new window

YML

YAML的语法和其他高级语言类似,并且可以简单表达清单、散列表,标量等数据形态。它使用空白符号缩进和大量依赖外观的特色,特别适合用来表达或编辑数据结构、各种配置文件,YML也在许多项目里以配置文件的形式存在,它的内容结构更加简洁,一目了然。go官方并没有提供对于YML的支持,我们需要使用第三方包。

go get github.com/go-yaml/yaml

主要方法

func Marshal(in interface{}) (out []byte, err error) //序列化

func Unmarshal(in []byte, out interface{}) (err error) //反序列化

先准备结构体

type Config struct {
   Database string `yaml:"database"`
   Url      string `yaml:"url"`
   Port     int    `yaml:"port"`
   Username string `yaml:"username"`
   Password string `yaml:"password"`
}

配置文件

database: mysql
url: 127.0.0.1
port: 3306
username: root
password: 123456

序列化

func main() {
   config := Config{
      Database: "oracle",
      Url:      "localhost",
      Port:     3326,
      Username: "root",
      Password: "123456",
   }

   out, err := yaml.Marshal(config)
   if err != nil {
      fmt.Println(err)
      return
   }
   fmt.Println(string(out))
}

输出

database: oracle
url: localhost
port: 3326
username: root
password: "123456"

不过由于yml本身有着严格的缩进语法,所以也不存在什么序列化格式化的问题了。

反序列化

func main() {
   bytes, err := os.ReadFile("./src/config.yml")
   if err != nil {
      fmt.Println(err)
      return
   }
   var config Config
   err = yaml.Unmarshal(bytes, &config)
   if err != nil {
      fmt.Println(err)
      return
   }

   fmt.Println(config)
}

输出

{mysql 127.0.0.1 3306 root 123456}

JSON

jsonRestful风格的接口通信中经常会用到,其相较于xml更轻便的大小,低廉的学习成本使其在web领域称为了主流的数据交换格式。

在go中,encoding/json包下提供对应的函数来进行json的序列化与反序列化,主要使用的有如下函数。

func Marshal(v any) ([]byte, error) //将go对象序列化为json字符串

func Unmarshal(data []byte, v any) error //将json字符串反序列化为go对象

首先定义结构体

type Person struct {
   UserId   string
   Username string
   Age      int    
   Address  string
}

序列化

func main() {
	person := Person{
		UserId:   "120",
		Username: "jack",
		Age:      18,
		Address:  "usa",
	}

	bytes, err := json.Marshal(person)
	if err != nil {
		fmt.Println(err)
		return
	}
	fmt.Println(string(bytes))
}

结果

{"UserId":"120","Username":"jack","Age":18,"Address":"usa"}

字段重命名

我们可以通过结构体标签来达到重命名的效果。

type Person struct {
   UserId   string `json:"id"`
   Username string `json:"name"`
   Age      int    `json:"age"`
   Address  string `json:"address"`
}

此时输出

{"id":"1202","name":"jack","age":19,"address":"USA"}

缩进

序列化时默认是没有任何缩进的,这是为了减少传输过程的空间损耗,但是这并不利于人为观察,在一些情况下我们需要将其序列化成人类能够观察的形式。为此,只需要换一个函数。

func MarshalIndent(v any, prefix, indent string) ([]byte, error)
func main() {
   person := Person{
      UserId:   "1202",
      Username: "jack",
      Age:      19,
      Address:  "USA",
   }
   bytes, err := json.MarshalIndent(person, "", "\t")
   if err != nil {
      fmt.Println(err)
      return
   }
   fmt.Println(string(bytes))
}

输出如下

{
        "id": "1202",
        "name": "jack",
        "age": 19,
        "address": "USA"
}

反序列化

在反序列化时需要注意,如果结构体有json标签的话,则字段名优先以json标签为准,否则以结构体属性名为准。

func main() {
	person := Person{}

	jsonStr := "{\"id\":\"120\",\"name\":\"jack\",\"age\":18,\"address\":\"usa\"}\n"

	err := json.Unmarshal([]byte(jsonStr), &person)
	if err != nil {
		fmt.Println(err)
		return
	}
	fmt.Printf("%+v", person)
}

输出

{UserId:120 Username:jack Age:18 Address:usa}

Protocol Buffers

protoco是谷歌2008开源的语言中立,协议中立,可扩展的结构化数据序列化机制。相比于以上三种更加的轻便,而且在解包封包的时候更加的快速,多用于RPC领域通信相关。Protoc 教程

安装依赖

go get github.com/golang/protobuf/proto

person.proto文件

syntax = "proto3";

option go_package = "./;person";

package proto;

enum Gender{
  MAIL = 0;
  FE_MAIL = 1;
}

message person {
  string name = 1;
  int32 age = 2;
  Gender gender = 3;
}

生成文件后

package main

import (
   p "GoProject/src/proto"
   "fmt"
   "github.com/golang/protobuf/proto"
)

func main() {
	person := p.Person{
		Name:   "wyh",
		Age:    12,
		Gender: p.Gender_FE_MAIL,
	}

	data, err := proto.Marshal(&person)//序列化
	if err != nil {
		fmt.Println(err)
		return
	}
	temp := &p.Person{}
	fmt.Println("proto buffer len: ", len(data), "bytes:", data)
	err = proto.Unmarshal(data, temp)//反序列化
	if err != nil {
		fmt.Println(err)
		return
	}
	fmt.Println(temp)
}

输出

proto buffer len:  9 bytes: [10 3 119 121 104 16 12 24 1]
name:"wyh"  age:12  gender:FE_MAIL