教程
发布于: 2024年1月15日
作者: 技术团队

Protocol Buffers 基础入门指南

从零开始学习 Protocol Buffers,了解其基本概念、语法和使用方法。

tutorial
protobuf
basics

Protocol Buffers 基础入门指南

Protocol Buffers(简称 Protobuf)是 Google 开发的一种语言无关、平台无关的序列化数据结构的方法。它被设计用来替代 XML 和 JSON,提供更高效的数据传输和存储方案。

什么是 Protocol Buffers?

Protocol Buffers 是一种轻便高效的结构化数据存储格式,可以用于结构化数据串行化,或者说序列化。它很适合做数据存储或 RPC 数据交换格式。

主要特点

  • 高效性:比 XML 小 3-10 倍,比 XML 快 20-100 倍
  • 语言无关:支持多种编程语言
  • 平台无关:可在不同操作系统间使用
  • 向后兼容:可以更新数据结构而不破坏已部署的程序

基本语法

定义消息类型

syntax = "proto3";



message Person {

  string name = 1;

  int32 id = 2;

  string email = 3;

  repeated string phone = 4;

}

字段类型

Protobuf 支持多种数据类型:

  • 标量类型:double, float, int32, int64, uint32, uint64, sint32, sint64, fixed32, fixed64, sfixed32, sfixed64, bool, string, bytes
  • 枚举类型:enum
  • 消息类型:其他 message 类型
  • 重复字段:repeated

使用示例

1. 创建 .proto 文件

syntax = "proto3";



package tutorial;



message AddressBook {

  repeated Person people = 1;

}



message Person {

  string name = 1;

  int32 id = 2;

  string email = 3;

  

  enum PhoneType {

    MOBILE = 0;

    HOME = 1;

    WORK = 2;

  }

  

  message PhoneNumber {

    string number = 1;

    PhoneType type = 2;

  }

  

  repeated PhoneNumber phones = 4;

}

2. 生成代码

使用 protoc 编译器生成对应语言的代码:

# 生成 Python 代码

protoc --python_out=. addressbook.proto



# 生成 Java 代码

protoc --java_out=. addressbook.proto



# 生成 C++ 代码

protoc --cpp_out=. addressbook.proto

3. 使用生成的代码

# Python 示例

import addressbook_pb2



# 创建新的 person 对象

person = addressbook_pb2.Person()

person.name = "John Doe"

person.id = 1234

person.email = "[email protected]"



# 序列化

data = person.SerializeToString()



# 反序列化

new_person = addressbook_pb2.Person()

new_person.ParseFromString(data)

最佳实践

1. 字段编号管理

  • 字段编号 1-15 使用 1 个字节编码,应优先分配给常用字段
  • 字段编号 16-2047 使用 2 个字节编码
  • 不要重复使用已删除字段的编号

2. 向后兼容性

  • 不要更改现有字段的编号
  • 新增字段应该是 optional 或 repeated
  • 可以删除字段,但要保留字段编号

3. 性能优化

  • 使用合适的数据类型
  • 避免过深的嵌套结构
  • 合理使用 repeated 字段

与其他格式对比

| 特性 | Protobuf | JSON | XML | |------|----------|------|-----| | 大小 | 最小 | 中等 | 最大 | | 速度 | 最快 | 中等 | 最慢 | | 可读性 | 低 | 高 | 高 | | Schema | 强制 | 可选 | 可选 | | 类型安全 | 强 | 弱 | 弱 |

总结

Protocol Buffers 是一个强大的序列化工具,特别适合需要高性能数据传输的场景。虽然学习曲线相对陡峭,但其带来的性能提升和类型安全性使其成为现代应用开发的重要工具。

在下一篇文章中,我们将深入探讨 Protobuf 与 JSON 的性能对比,帮助您在实际项目中做出最佳选择。

相关文章

如何根据 Proto 文件生成对应语言的代码
详细介绍如何使用 Protocol Buffers 编译器从 .proto 文件生成各种编程语言的代码文件,包括安装配置、命令使用和实际示例。
Protobuf vs JSON:性能对比与选择指南
深入分析 Protobuf 和 JSON 的性能差异,帮助您选择合适的数据格式。