Apache Tika html parser module


Apache Tika html parser module

Apache Tika is a toolkit for detecting and extracting metadata and structured text content from various documents using existing parser libraries.

Compile εξαρτήσεις (3)

Ομάδα / Τεχνούργημα Έκδοση Νεότερη Έκδοση
org.apache.tika » tika-parser-html-commons 2.1.0 NA
commons-codec » commons-codec 1.15 NA
org.ccil.cowan.tagsoup » tagsoup 1.2.1 NA

Provided εξαρτήσεις (1)

Ομάδα / Τεχνούργημα Έκδοση Νεότερη Έκδοση
org.apache.tika » tika-core 2.1.0 1.27

Test εξαρτήσεις (3)

Ομάδα / Τεχνούργημα Έκδοση Νεότερη Έκδοση
org.junit.jupiter » junit-jupiter-engine 5.8.0-M1 5.11.0-M2
org.junit.jupiter » junit-jupiter-api 5.8.0-M1 5.11.0-M2
org.apache.tika » tika-parser-text-module 2.1.0 NA