AVRO - 通过生成类进行反序列化


如前所述,可以通过生成与模式对应的类或使用解析器库将 Avro 模式读入程序中。本章介绍如何通过生成类来读取模式并使用 Avro反序列化数据。

通过生成类进行反序列化

序列化数据存储在文件emp.avro中。您可以使用 Avro 反序列化并读取它。

存储序列化数据

按照下面给出的过程对文件中的序列化数据进行反序列化。

步骤1

使用SpecificDatumReader类创建DatumReader接口的对象。

DatumReader<emp>empDatumReader = new SpecificDatumReader<emp>(emp.class);

第2步

emp类实例化DataFileReader。此类从文件中读取序列化数据。它需要Dataumeader对象和序列化数据所在文件的路径作为构造函数的参数。

DataFileReader<emp> dataFileReader = new DataFileReader(new File("/path/to/emp.avro"), empDatumReader);

步骤3

使用DataFileReader的方法打印反序列化的数据。

  • 如果 Reader 中有任何元素,hasNext() 方法将返回一个布尔值

  • DataFileReader的next ()方法返回 Reader 中的数据。

while(dataFileReader.hasNext()){

   em=dataFileReader.next(em);
   System.out.println(em);
}

示例 – 通过生成类进行反序列化

以下完整程序展示了如何使用 Avro 反序列化文件中的数据。

import java.io.File;
import java.io.IOException;

import org.apache.avro.file.DataFileReader;
import org.apache.avro.io.DatumReader;
import org.apache.avro.specific.SpecificDatumReader;

public class Deserialize {
   public static void main(String args[]) throws IOException{
	
      //DeSerializing the objects
      DatumReader<emp> empDatumReader = new SpecificDatumReader<emp>(emp.class);
		
      //Instantiating DataFileReader
      DataFileReader<emp> dataFileReader = new DataFileReader<emp>(new
         File("/home/Hadoop/Avro_Work/with_code_genfile/emp.avro"), empDatumReader);
      emp em=null;
		
      while(dataFileReader.hasNext()){
      
         em=dataFileReader.next(em);
         System.out.println(em);
      }
   }
}

浏览到生成的代码所在的目录。在本例中,位于home/Hadoop/Avro_work/with_code_gen。

$ cd home/Hadoop/Avro_work/with_code_gen/

现在,将上述程序复制并保存在名为DeSerialize.java的文件中。编译并执行它,如下所示 -

$ javac Deserialize.java
$ java Deserialize

输出

{"name": "omar", "id": 1, "salary": 30000, "age": 21, "address": "Hyderabad"}
{"name": "ram", "id": 2, "salary": 40000, "age": 30, "address": "Hyderabad"}
{"name": "robbin", "id": 3, "salary": 35000, "age": 25, "address": "Hyderabad"}