Quiero leer cada bit de contenido en un PDF usando asp .net. ¿Cómo podré hacer eso? Cosas Personales

Quiero leer cada bit de contenido en un PDF usando asp .net. ¿Cómo podré hacer eso?

Puede usar el paquete itextsharp nuget y el código será algo como esto.

if (Request.Files [“FileUpload1”]. ContentLength> 0)
{
string FileName = System.IO.Path.GetFileName (Request.Files [“FileUpload1”]. FileName);
string fileExtension = System.IO.Path.GetExtension (Request.Files [“FileUpload1”]. FileName);
if (fileExtension == “.pdf” || fileExtension == “.xlsx”)
{
// Cree una carpeta en App_Data llamada ExcelFiles porque necesita guardar la ubicación temporal del archivo y obtener datos de allí.
string filePath = string.Format (“{0} / {1}”, Server.MapPath (“~ / Content / UploadedFolder”), Request.Files [“FileUpload1”]. FileName);

Request.Files [“FileUpload1”]. SaveAs (filePath);
if (textFormat == “IMAGEN”)
{
ConvertAsImage (filePath, userTypeEnum, entityId, planetBookTitle, planetBookDescription, bookViewAccess);
}
si no (textFormat == “TEXT”)
{
ConvertAsPlainText (filePath, userTypeEnum, entityId, planetBookTitle, planetBookDescription, bookViewAccess);
}

}
}
Spire.Pdf.PdfDocument doc = nuevo Spire.Pdf.PdfDocument ();
doc.LoadFromFile (filePath);
StringBuilder buffer = nuevo StringBuilder ();
int cuenta = doc.Pages.Count;
para (int i = 1; i <cuenta; i ++)
{

Bitmap bp = nuevo Bitmap (doc.SaveAsImage (i));
string OutputImageName = “PDF_” + RandomString () + “” + i + “.png”;
bp.Save (OutputFile + OutputImageName);
bp.Dispose ();
buffer.Append (doc.Pages [i] .ExtractText ());
System.IO.File.WriteAllText (OutputTextFile, buffer.ToString ());

string filterString = “”;
if (doc.Pages [i] .ExtractText (). Longitud> 13)
{
filterString = doc.Pages [i] .ExtractText (). Substring (13, 23);
}
más
{
filterString = doc.Pages [i] .ExtractText ();
}
}