Solliciteren op de vacature...
Er is helaas iets misgegaan bij het openen van de pagina. Probeer het nog een keer.

Venster wordt geladen...

Solliciteren op de vacature...
Er is helaas iets misgegaan bij het openen van de pagina. Probeer het nog een keer.

Venster wordt geladen...

Aanmelden op Uitzendbureau.nl
Er is helaas iets misgegaan bij het openen van de aanmeldpagina. Probeer het nog een keer.

Venster wordt geladen...

Wachtwoord vergeten
Er is helaas iets misgegaan bij het openen van de pagina. Probeer het nog een keer.

Venster wordt geladen...

Uitloggen
Er is helaas iets misgegaan bij het afmelden. Probeer het nog een keer.

Venster wordt geladen...

Sollicitatie verzonden
Er is helaas iets misgegaan bij het aanmelden. Probeer het nog een keer.
Er is iets mis gegaan bij het registreren. Probeer het nog een keer.

Venster wordt geladen...

logo
  • 5 km
  • 10 km
  • 30 km
  • 50 km

  • Alles
  • 5 km
  • 10 km
  • 30 km
  • 50 km

  • Alles
  Ga terug naar vacatures
NLP PEOPLE uitzendbureau

Language engineer

NLP PEOPLE Amsterdam
50.000 tot 70.000
32 - 40 uur
nieuw
Status Open
Nu solliciteren

Solliciteer op de website van het uitzendbureau


Wat wij vragen

Opleiding

Er is geen minimale opleiding vereist

Talen
  • Je beheerst Engels

Wat wij bieden

Salaris
€ 50.000 tot € 70.000
Uren
32 tot 40 uur per week
Dienstverband
fulltime

Vacaturebeschrijving

We are a dynamic and innovative small-sized SaaS company specializing in language data products and services. We are a team of 17, distributed across two offices in Amsterdam and Thessaloniki.

About the Project

TAUS is executing technical workstreams for the European Commission’s BEACON project, focused on collecting, curating, and publishing high-quality parallel text corpora for machine translation in EU candidate country languages. This 9-month project involves processing hundreds of millions of sentences from diverse sources, applying rigorous quality assurance frameworks, and preparing publication-ready datasets for seven language pairs: English paired with Ukrainian, Serbian, Bosnian, Macedonian, Albanian, Montenegrin, and Romanian/Moldovan, with particular focus on legal and administrative domains.

Position Overview

We seek a skilled and motivated Language Data Engineer to join our technical team for large-scale parallel corpus collection, processing, and quality assurance. You will work hands‑on with real‑world challenges in low‑resource language processing, quality assurance at scale, and contribute directly to expanding Europe’s multilingual digital infrastructure.

Responsibilities
  • Download and catalog parallel corpora from public repositories and implement targeted web crawling for legal/administrative domain content.
  • Extract text from diverse formats (PDFs, HTML, document archives) and apply bilingual as well as monolingual corpus mining techniques.
  • Document source provenance, licensing, and metadata comprehensively.
  • Execute preprocessing pipelines: format normalization, sentence segmentation, alignment, language identification, and quality filtering.
  • Handle large‑scale data processing with deduplication and anonymization.
  • Maintain detailed processing logs and quality metrics throughout the pipeline.
  • Validate NLP tool performance across seven language pairs and implement automated quality checks (alignment confidence, language ID accuracy, domain classification).
  • Coordinate with linguists for human validation and generate quality reports with statistical metrics.
  • Troubleshoot and resolve quality issues in processing workflows.
  • Contribute to technical deliverables and project documentation meeting EC standards.
  • Collaborate with European Commission experts and cross‑functional teams on methodology and quality criteria.
  • Ensure compliance with EU data governance, GDPR, and licensing requirements.
Company

TAUS

Qualifications
  • 3+ years of work experience with Natural Language Processing (NLP)
  • 3+ years of work experience with Python (Programming Language)
Specific requirements
  • Authorized to work in Yes
Level of experience (years)

Mid Career (2+ years of experience)

Tagged as:
  • Classification
  • Industry
  • Machine Translation
  • Natural Language Processing
  • Netherlands
  • NLP
#J-18808-Ljbffr
Salarisomschrijving

€50000.00 - €70000.00 monthly

Nu solliciteren

Solliciteer op de website van het uitzendbureau

Nu solliciteren

Solliciteer op de website van het uitzendbureau


Vacature acties

Opslaan als favoriet
Vacature delen
Of solliciteer later

Dagelijks nieuwe vacatures in je inbox?

  • Mis nooit een vacature
  • Op basis van jouw voorkeuren
  • Zet stop wanneer je wilt

Alle vacatures


Amsterdam Noord-Holland Technisch Engineer

Snelle links

  • Inschrijven
  • Maak cv
  • Zoek uitzendbureau
  • Bedrijven op Uitzendbureau.nl

Vacatures

  • Vacatures zoeken
  • Vacatures per locatie
  • Vacatures per beroepsgroep
  • Vacatures per dienstverband
  • Vacatures per opleidingsniveau

Uitzendbureau.nl

  • Help
  • Over ons
  • Algemene voorwaarden
  • Vacatures plaatsen
© 2026 Uitzendbureau.nl