RubyGems Navigation menu

wp2txt 2.1.1

WP2TXT extracts text and category data from Wikipedia dump files (encoded in XML / compressed with Bzip2), removing MediaWiki markup and other metadata.

Gemfile:
=

installation:
=

Versions:

  1. 2.1.1 February 21, 2026 (300 ko)
  2. 2.1.0 February 19, 2026 (299 ko)
  3. 1.1.3 May 13, 2023 (7,78 Mo)
  4. 1.1.2 April 15, 2023 (7,78 Mo)
  5. 1.1.1 January 25, 2023 (7,78 Mo)
Voir toutes les versions (31)

Dépendances de Runtime (8):

Dépendances de Development (5):

bundler >= 0
rake >= 0
rspec >= 0
simplecov >= 0
webmock >= 0

Propriétaires:

Pushed by:

Auteurs:

  • Yoichiro Hasebe

Total de contrôle SHA 256:

=

Total de téléchargements 72 107

Pour cette version 203

Version publiée:

License:

MIT

Version de Ruby requise: >= 3.0

Liens: