Find Jobs
Hire Freelancers

Data Extraction/ Transformation w/ continual monthly milestones long-term

$250-750 USD

Terminado
Publicado hace más de 11 años

$250-750 USD

Pagado a la entrega
Project Description: We are looking to build an Open Access archive of freely available scholarly journals which we want the article level data and associated meta data defined below. [login to view URL] is a good explanation of what the content and project field is related to. We would like this project to continue long-term. Requirements: A. Create a harvesting engine in your own choice of coding (parallel processing has proved the best results) that can: 1.) Crawl specific Internet sites (targets), we will help with the target choices, OAI is one method some sites support 2.) If not crawling read from an input file to gleam the data, some sites supply 3.) Ensure the data is accurate and test URLs for correctness 4.) Dump the defined data to a text delimited file format 5.) Transfer the data via ftp to us B. Work with us to find new resources and refresh existing sources on a monthly basis at $500 usd/month. C. Provide new and updated data feeds continually D. Provide your own platform to run the harvests, a multi-core processor should be sufficient E. The data provided will be Article level data relative to each Journal. The detail data will need these output fields: "Publisher", "Journal Title", “Article Title”, "ISSN", "Alternate ISSN", "Journal Year", "JournalVol","JournalIssue", "HTML URL", "PDF URL", "Start Page", "End Page" NOTE: Journal level data is easy to get, all the articles in the journal are a little more of a challenge. Sample data attached to project.
ID del proyecto: 3996484

Información sobre el proyecto

10 propuestas
Proyecto remoto
Activo hace 11 años

¿Buscas ganar dinero?

Beneficios de presentar ofertas en Freelancer

Fija tu plazo y presupuesto
Cobra por tu trabajo
Describe tu propuesta
Es gratis registrarse y presentar ofertas en los trabajos
Adjudicado a:
Avatar del usuario
Hi, I am very interested in the project,please check your PMB
$347 USD en 5 días
5,0 (6 comentarios)
6,8
6,8
10 freelancers están ofertando un promedio de $420 USD por este trabajo
Avatar del usuario
Hi sir, please check PM, thx Kimi.
$250 USD en 5 días
5,0 (271 comentarios)
7,5
7,5
Avatar del usuario
Hello, I am a Java expert from China, I have lots experience on this kind project(extraction and trafomation), I like long term and stable cooperation,so I am very interested in this project, please let me know your thoughts Thnaks Bing
$550 USD en 10 días
4,9 (110 comentarios)
7,4
7,4
Avatar del usuario
Hello, please refer to your INBOX. Thank You .
$500 USD en 10 días
5,0 (103 comentarios)
7,5
7,5
Avatar del usuario
fast epoll based search engine with module style site parsers perl, linux
$500 USD en 7 días
5,0 (21 comentarios)
4,5
4,5
Avatar del usuario
Hello! Im very interested!
$500 USD en 10 días
5,0 (5 comentarios)
4,2
4,2
Avatar del usuario
Hi , I am interested in taking this project. Please check my PMB for more details.
$550 USD en 15 días
4,1 (3 comentarios)
5,2
5,2
Avatar del usuario
Please check my PM.
$250 USD en 4 días
4,9 (5 comentarios)
3,7
3,7
Avatar del usuario
We are freelance software developers. If you contact me I can give a quote for your project and we can discuss the details. <b><i>Removed by Admin</i></b>
$500 USD en 1 día
0,0 (0 comentarios)
0,0
0,0

Sobre este cliente

Bandera de UNITED STATES
Windsor, United States
5,0
8
Forma de pago verificada
Miembro desde nov 8, 2010

Verificación del cliente

¡Gracias! Te hemos enviado un enlace para reclamar tu crédito gratuito.
Algo salió mal al enviar tu correo electrónico. Por favor, intenta de nuevo.
Usuarios registrados Total de empleos publicados
Freelancer ® is a registered Trademark of Freelancer Technology Pty Limited (ACN 142 189 759)
Copyright © 2024 Freelancer Technology Pty Limited (ACN 142 189 759)
Cargando visualización previa
Permiso concedido para Geolocalización.
Tu sesión de acceso ha expirado y has sido desconectado. Por favor, inica sesión nuevamente.