Quiero leer cada bit de contenido en un PDF usando asp .net. ¿Cómo podré hacer eso?

Puede usar el paquete itextsharp nuget y el código será algo como esto.

if (Request.Files [“FileUpload1”]. ContentLength> 0)
{
string FileName = System.IO.Path.GetFileName (Request.Files [“FileUpload1”]. FileName);
string fileExtension = System.IO.Path.GetExtension (Request.Files [“FileUpload1”]. FileName);
if (fileExtension == “.pdf” || fileExtension == “.xlsx”)
{
// Cree una carpeta en App_Data llamada ExcelFiles porque necesita guardar la ubicación temporal del archivo y obtener datos de allí.
string filePath = string.Format (“{0} / {1}”, Server.MapPath (“~ / Content / UploadedFolder”), Request.Files [“FileUpload1”]. FileName);

Request.Files [“FileUpload1”]. SaveAs (filePath);
if (textFormat == “IMAGEN”)
{
ConvertAsImage (filePath, userTypeEnum, entityId, planetBookTitle, planetBookDescription, bookViewAccess);
}
si no (textFormat == “TEXT”)
{
ConvertAsPlainText (filePath, userTypeEnum, entityId, planetBookTitle, planetBookDescription, bookViewAccess);
}

}
}
Spire.Pdf.PdfDocument doc = nuevo Spire.Pdf.PdfDocument ();
doc.LoadFromFile (filePath);
StringBuilder buffer = nuevo StringBuilder ();
int cuenta = doc.Pages.Count;
para (int i = 1; i <cuenta; i ++)
{

Bitmap bp = nuevo Bitmap (doc.SaveAsImage (i));
string OutputImageName = “PDF_” + RandomString () + “” + i + “.png”;
bp.Save (OutputFile + OutputImageName);
bp.Dispose ();
buffer.Append (doc.Pages [i] .ExtractText ());
System.IO.File.WriteAllText (OutputTextFile, buffer.ToString ());

string filterString = “”;
if (doc.Pages [i] .ExtractText (). Longitud> 13)
{
filterString = doc.Pages [i] .ExtractText (). Substring (13, 23);
}
más
{
filterString = doc.Pages [i] .ExtractText ();
}
}