apache
diff --git a/‎parquet-common/src/main/java/org/apache/parquet/bytes/TrackingByteBufferAllocator.java‎
Lines changed: 12 additions & 29 deletions b/‎parquet-common/src/main/java/org/apache/parquet/bytes/TrackingByteBufferAllocator.java‎
Lines changed: 12 additions & 29 deletions
diff --git a/‎parquet-hadoop/src/main/java/org/apache/parquet/hadoop/ParquetFileReader.java‎
Lines changed: 25 additions & 3 deletions b/‎parquet-hadoop/src/main/java/org/apache/parquet/hadoop/ParquetFileReader.java‎
Lines changed: 25 additions & 3 deletions
diff --git a/‎parquet-hadoop/src/test/java/org/apache/parquet/crypto/propertiesfactory/SchemaControlEncryptionTest.java‎
Lines changed: 13 additions & 13 deletions b/‎parquet-hadoop/src/test/java/org/apache/parquet/crypto/propertiesfactory/SchemaControlEncryptionTest.java‎
Lines changed: 13 additions & 13 deletions
diff --git a/‎parquet-hadoop/src/test/java/org/apache/parquet/encodings/FileEncodingsIT.java‎
Lines changed: 34 additions & 34 deletions b/‎parquet-hadoop/src/test/java/org/apache/parquet/encodings/FileEncodingsIT.java‎
Lines changed: 34 additions & 34 deletions
diff --git a/‎parquet-hadoop/src/test/java/org/apache/parquet/filter2/TestFiltersWithMissingColumns.java‎
Lines changed: 3 additions & 7 deletions b/‎parquet-hadoop/src/test/java/org/apache/parquet/filter2/TestFiltersWithMissingColumns.java‎
Lines changed: 3 additions & 7 deletions
diff --git a/‎parquet-hadoop/src/test/java/org/apache/parquet/hadoop/TestColumnChunkPageWriteStore.java‎
Lines changed: 28 additions & 29 deletions b/‎parquet-hadoop/src/test/java/org/apache/parquet/hadoop/TestColumnChunkPageWriteStore.java‎
Lines changed: 28 additions & 29 deletions
@@ -20,10 +20,8 @@
 
 import java.nio.ByteBuffer;
 import java.util.HashMap;
-import java.util.HashSet;
 import java.util.Map;
 import java.util.Objects;
-import java.util.Set;
 
 /**
  * A wrapper {@link ByteBufferAllocator} implementation that tracks whether all allocated buffers are released. It
@@ -51,11 +49,7 @@ private static class Key {
     private final ByteBuffer buffer;
 
     Key(ByteBuffer buffer) {
-      if (!buffer.isDirect() && buffer.hasArray()) {
-        hashCode = System.identityHashCode(buffer.array());
-      } else {
-        hashCode = System.identityHashCode(buffer);
-      }
+      hashCode = System.identityHashCode(buffer);
       this.buffer = buffer;
     }
 
@@ -68,9 +62,6 @@ public boolean equals(Object o) {
         return false;
       }
       Key key = (Key) o;
-      if (!buffer.isDirect() && buffer.hasArray() && !key.buffer.isDirect() && key.buffer.hasArray()) {
-        return buffer.array() == key.buffer.array();
-      }
       return this.buffer == key.buffer;
     }
 
@@ -133,7 +124,6 @@ private LeakedByteBufferException(int count, ByteBufferAllocationStacktraceExcep
   }
 
   private final Map<Key, ByteBufferAllocationStacktraceException> allocated = new HashMap<>();
-  private final Set<Object> releasedArrays = new HashSet<>();
   private final ByteBufferAllocator allocator;
 
   private TrackingByteBufferAllocator(ByteBufferAllocator allocator) {
@@ -150,19 +140,12 @@ public ByteBuffer allocate(int size) {
   @Override
   public void release(ByteBuffer b) throws ReleasingUnallocatedByteBufferException {
     Objects.requireNonNull(b);
-    if (allocated.remove(new Key(b)) != null) {
-      allocator.release(b);
-      if (!b.isDirect() && b.hasArray()) {
-        releasedArrays.add(b.array());
-      }
-      b.clear();
-      return;
-    }
-    if (!b.isDirect() && b.hasArray() && releasedArrays.contains(b.array())) {
-      b.clear();
-      return;
+    if (allocated.remove(new Key(b)) == null) {
+      throw new ReleasingUnallocatedByteBufferException();
     }
-    throw new ReleasingUnallocatedByteBufferException();
+    allocator.release(b);
+    // Clearing the buffer so subsequent access would probably generate errors
+    b.clear();
   }
 
   @Override
@@ -171,12 +154,12 @@ public boolean isDirect() {
   }
 
   @Override
-  public void close() {
-    // Release all remaining buffers through the underlying allocator
-    // so they are properly freed (e.g. direct memory cleanup).
-    for (Key key : allocated.keySet()) {
-      allocator.release(key.buffer);
+  public void close() throws LeakedByteBufferException {
+    if (!allocated.isEmpty()) {
+      LeakedByteBufferException ex = new LeakedByteBufferException(
+          allocated.size(), allocated.values().iterator().next());
+      allocated.clear(); // Drop the references to the ByteBuffers, so they can be gc'd
+      throw ex;
     }
-    allocated.clear();
   }
 }
@@ -65,6 +65,7 @@
 import org.apache.parquet.HadoopReadOptions;
 import org.apache.parquet.ParquetReadOptions;
 import org.apache.parquet.Preconditions;
+import org.apache.parquet.bytes.ByteBufferAllocator;
 import org.apache.parquet.bytes.ByteBufferInputStream;
 import org.apache.parquet.bytes.ByteBufferReleaser;
 import org.apache.parquet.bytes.BytesInput;
@@ -1361,8 +1362,30 @@ private void readVectored(List<ConsecutivePartList> allParts, ChunkListBuilder b
       totalSize += len;
     }
     LOG.debug("Reading {} bytes of data with vectored IO in {} ranges", totalSize, ranges.size());
-    // Request a vectored read;
-    f.readVectored(ranges, options.getAllocator());
+    // Request a vectored read; track all buffers allocated during the call so that
+    // internal buffers (e.g. from ChecksumFileSystem) are also released.
+    List<ByteBuffer> allocatedBuffers = new ArrayList<>();
+    ByteBufferAllocator allocator = options.getAllocator();
+    ByteBufferAllocator trackingAllocator = new ByteBufferAllocator() {
+      @Override
+      public ByteBuffer allocate(int size) {
+        ByteBuffer buf = allocator.allocate(size);
+        allocatedBuffers.add(buf);
+        return buf;
+      }
+
+      @Override
+      public void release(ByteBuffer b) {
+        allocator.release(b);
+      }
+
+      @Override
+      public boolean isDirect() {
+        return allocator.isDirect();
+      }
+    };
+    f.readVectored(ranges, trackingAllocator);
+    builder.addBuffersToRelease(allocatedBuffers);
     int k = 0;
     for (ConsecutivePartList consecutivePart : allParts) {
       ParquetFileRange currRange = ranges.get(k++);
@@ -2327,7 +2350,6 @@ public void readFromVectoredRange(ParquetFileRange currRange, ChunkListBuilder b
         LOG.error(error, e);
         throw new IOException(error, e);
       }
-      builder.addBuffersToRelease(Collections.singletonList(buffer));
       ByteBufferInputStream stream = ByteBufferInputStream.wrap(buffer);
       for (ChunkDescriptor descriptor : chunks) {
         builder.add(descriptor, stream.sliceBuffers(descriptor.size), f);
 
@@ -167,21 +167,21 @@ private String encryptParquetFile(String file, Configuration conf) throws IOExce
   }
 
   private void decryptParquetFileAndValid(String file, Configuration conf) throws IOException {
-    ParquetReader<Group> reader = ParquetReader.builder(new GroupReadSupport(), new Path(file))
+    try (ParquetReader<Group> reader = ParquetReader.builder(new GroupReadSupport(), new Path(file))
         .withConf(conf)
-        .build();
-    for (int i = 0; i < numRecord; i++) {
-      Group group = reader.read();
-      assertEquals(testData.get("Name")[i], group.getBinary("Name", 0).toStringUsingUTF8());
-      assertEquals(testData.get("Age")[i], group.getLong("Age", 0));
-
-      Group subGroup = group.getGroup("WebLinks", 0);
-      assertArrayEquals(
-          subGroup.getBinary("LinkedIn", 0).getBytes(), ((String) testData.get("LinkedIn")[i]).getBytes());
-      assertArrayEquals(
-          subGroup.getBinary("Twitter", 0).getBytes(), ((String) testData.get("Twitter")[i]).getBytes());
+        .build()) {
+      for (int i = 0; i < numRecord; i++) {
+        Group group = reader.read();
+        assertEquals(testData.get("Name")[i], group.getBinary("Name", 0).toStringUsingUTF8());
+        assertEquals(testData.get("Age")[i], group.getLong("Age", 0));
+
+        Group subGroup = group.getGroup("WebLinks", 0);
+        assertArrayEquals(
+            subGroup.getBinary("LinkedIn", 0).getBytes(), ((String) testData.get("LinkedIn")[i]).getBytes());
+        assertArrayEquals(
+            subGroup.getBinary("Twitter", 0).getBytes(), ((String) testData.get("Twitter")[i]).getBytes());
+      }
     }
-    reader.close();
   }
 
   private static String createTempFile(String prefix) {
 
@@ -254,7 +254,7 @@ private void writeValuesToFile(
     SimpleGroupFactory message = new SimpleGroupFactory(schema);
     GroupWriteSupport.setSchema(schema, configuration);
 
-    ParquetWriter<Group> writer = ExampleParquetWriter.builder(file)
+    try (ParquetWriter<Group> writer = ExampleParquetWriter.builder(file)
         .withAllocator(allocator)
         .withCompressionCodec(compression)
         .withRowGroupSize(rowGroupSize)
@@ -263,36 +263,35 @@ private void writeValuesToFile(
         .withDictionaryEncoding(enableDictionary)
         .withWriterVersion(version)
         .withConf(configuration)
-        .build();
-
-    for (Object o : values) {
-      switch (type) {
-        case BOOLEAN:
-          writer.write(message.newGroup().append("field", (Boolean) o));
-          break;
-        case INT32:
-          writer.write(message.newGroup().append("field", (Integer) o));
-          break;
-        case INT64:
-          writer.write(message.newGroup().append("field", (Long) o));
-          break;
-        case FLOAT:
-          writer.write(message.newGroup().append("field", (Float) o));
-          break;
-        case DOUBLE:
-          writer.write(message.newGroup().append("field", (Double) o));
-          break;
-        case INT96:
-        case BINARY:
-        case FIXED_LEN_BYTE_ARRAY:
-          writer.write(message.newGroup().append("field", (Binary) o));
-          break;
-        default:
-          throw new IllegalArgumentException("Unknown type name: " + type);
+        .build()) {
+
+      for (Object o : values) {
+        switch (type) {
+          case BOOLEAN:
+            writer.write(message.newGroup().append("field", (Boolean) o));
+            break;
+          case INT32:
+            writer.write(message.newGroup().append("field", (Integer) o));
+            break;
+          case INT64:
+            writer.write(message.newGroup().append("field", (Long) o));
+            break;
+          case FLOAT:
+            writer.write(message.newGroup().append("field", (Float) o));
+            break;
+          case DOUBLE:
+            writer.write(message.newGroup().append("field", (Double) o));
+            break;
+          case INT96:
+          case BINARY:
+          case FIXED_LEN_BYTE_ARRAY:
+            writer.write(message.newGroup().append("field", (Binary) o));
+            break;
+          default:
+            throw new IllegalArgumentException("Unknown type name: " + type);
+        }
       }
     }
-
-    writer.close();
   }
 
   private List<?> generateRandomValues(PrimitiveTypeName type, int count) {
@@ -522,16 +521,17 @@ private static List<PageReadStore> readBlocksFromFile(Path file) throws IOExcept
 
       ParquetMetadata metadata =
           ParquetFileReader.readFooter(configuration, file, ParquetMetadataConverter.NO_FILTER);
-      ParquetFileReader fileReader = new ParquetFileReader(
+      try (ParquetFileReader fileReader = new ParquetFileReader(
           configuration,
           metadata.getFileMetaData(),
           file,
           metadata.getBlocks(),
-          metadata.getFileMetaData().getSchema().getColumns());
+          metadata.getFileMetaData().getSchema().getColumns())) {
 
-      PageReadStore group;
-      while ((group = fileReader.readNextRowGroup()) != null) {
-        rowGroups.add(group);
+        PageReadStore group;
+        while ((group = fileReader.readNextRowGroup()) != null) {
+          rowGroups.add(group);
+        }
       }
 
       return rowGroups;
 
@@ -212,17 +212,13 @@ public void testOrMissingColumnFilter() throws Exception {
   }
 
   public static long countFilteredRecords(Path path, FilterPredicate pred) throws IOException {
-    ParquetReader<Group> reader = ParquetReader.builder(new GroupReadSupport(), path)
-        .withFilter(FilterCompat.get(pred))
-        .build();
-
     long count = 0;
-    try {
+    try (ParquetReader<Group> reader = ParquetReader.builder(new GroupReadSupport(), path)
+        .withFilter(FilterCompat.get(pred))
+        .build()) {
       while (reader.read() != null) {
         count += 1;
       }
-    } finally {
-      reader.close();
     }
     return count;
   }
 
@@ -215,36 +215,35 @@ public void test(Configuration config, ByteBufferAllocator allocator) throws Exc
 
     {
       ParquetMetadata footer = ParquetFileReader.readFooter(conf, file, NO_FILTER);
-      ParquetFileReader reader = new ParquetFileReader(
-          config, footer.getFileMetaData(), file, footer.getBlocks(), schema.getColumns());
-      PageReadStore rowGroup = reader.readNextRowGroup();
-      PageReader pageReader = rowGroup.getPageReader(col);
-      DataPageV2 page = (DataPageV2) pageReader.readPage();
-      assertEquals(rowCount, page.getRowCount());
-      assertEquals(nullCount, page.getNullCount());
-      assertEquals(valueCount, page.getValueCount());
-      assertEquals(d, intValue(page.getDefinitionLevels()));
-      assertEquals(r, intValue(page.getRepetitionLevels()));
-      assertEquals(dataEncoding, page.getDataEncoding());
-      assertEquals(v, intValue(page.getData()));
+      try (ParquetFileReader reader = new ParquetFileReader(
+          config, footer.getFileMetaData(), file, footer.getBlocks(), schema.getColumns())) {
+        PageReadStore rowGroup = reader.readNextRowGroup();
+        PageReader pageReader = rowGroup.getPageReader(col);
+        DataPageV2 page = (DataPageV2) pageReader.readPage();
+        assertEquals(rowCount, page.getRowCount());
+        assertEquals(nullCount, page.getNullCount());
+        assertEquals(valueCount, page.getValueCount());
+        assertEquals(d, intValue(page.getDefinitionLevels()));
+        assertEquals(r, intValue(page.getRepetitionLevels()));
+        assertEquals(dataEncoding, page.getDataEncoding());
+        assertEquals(v, intValue(page.getData()));
 
-      // Checking column/offset indexes for the one page
-      ColumnChunkMetaData column = footer.getBlocks().get(0).getColumns().get(0);
-      ColumnIndex columnIndex = reader.readColumnIndex(column);
-      assertArrayEquals(
-          statistics.getMinBytes(), columnIndex.getMinValues().get(0).array());
-      assertArrayEquals(
-          statistics.getMaxBytes(), columnIndex.getMaxValues().get(0).array());
-      assertEquals(
-          statistics.getNumNulls(), columnIndex.getNullCounts().get(0).longValue());
-      assertFalse(columnIndex.getNullPages().get(0));
-      OffsetIndex offsetIndex = reader.readOffsetIndex(column);
-      assertEquals(1, offsetIndex.getPageCount());
-      assertEquals(pageSize, offsetIndex.getCompressedPageSize(0));
-      assertEquals(0, offsetIndex.getFirstRowIndex(0));
-      assertEquals(pageOffset, offsetIndex.getOffset(0));
-
-      reader.close();
+        // Checking column/offset indexes for the one page
+        ColumnChunkMetaData column = footer.getBlocks().get(0).getColumns().get(0);
+        ColumnIndex columnIndex = reader.readColumnIndex(column);
+        assertArrayEquals(
+            statistics.getMinBytes(), columnIndex.getMinValues().get(0).array());
+        assertArrayEquals(
+            statistics.getMaxBytes(), columnIndex.getMaxValues().get(0).array());
+        assertEquals(
+            statistics.getNumNulls(), columnIndex.getNullCounts().get(0).longValue());
+        assertFalse(columnIndex.getNullPages().get(0));
+        OffsetIndex offsetIndex = reader.readOffsetIndex(column);
+        assertEquals(1, offsetIndex.getPageCount());
+        assertEquals(pageSize, offsetIndex.getCompressedPageSize(0));
+        assertEquals(0, offsetIndex.getFirstRowIndex(0));
+        assertEquals(pageOffset, offsetIndex.getOffset(0));
+      }
     }
   }
Original file line number	Diff line number	Diff line change
`@@ -212,17 +212,13 @@ public void testOrMissingColumnFilter() throws Exception {`
`212`	`212`	`}`
`213`	`213`
`214`	`214`	`public static long countFilteredRecords(Path path, FilterPredicate pred) throws IOException {`
`215`		`- ParquetReader<Group> reader = ParquetReader.builder(new GroupReadSupport(), path)`
`216`		`- .withFilter(FilterCompat.get(pred))`
`217`		`- .build();`
`218`		`-`
`219`	`215`	`long count = 0;`
`220`		`- try {`
	`216`	`+ try (ParquetReader<Group> reader = ParquetReader.builder(new GroupReadSupport(), path)`
	`217`	`+ .withFilter(FilterCompat.get(pred))`
	`218`	`+ .build()) {`
`221`	`219`	`while (reader.read() != null) {`
`222`	`220`	`count += 1;`
`223`	`221`	`}`
`224`		`- } finally {`
`225`		`- reader.close();`
`226`	`222`	`}`
`227`	`223`	`return count;`
`228`	`224`	`}`