Profile
Pastes: 76550
Members: 1489

Paste

Plain view | Edit code: here. | Add this to your website. | Report abuse.

Short URL: http://goo.gl/EuhVn

Pasted as Java by kasun on Friday, March 30th, 2012 5:16pm ( 3 years ago )

  1.          else if (userPath.equals("/topkphrases")) {
  2.                        
  3.               byte[] b = null;
  4.            try {
  5.                b = getBLOB("2");
  6.            } catch (Exception ex) {
  7.                 Logger.getLogger(ControlerServelet.class.getName()).log(Level.SEVERE, null, ex);
  8.            }
  9.      
  10.                                              ArrayList<String> sentenceList = new ArrayList<String>();      
  11.  Line------>(ControlerServelet.java:585)     sentenceList=pdfDocToSentence(b);
  12.          
  13.                                               request.setAttribute("allphrases", sentenceList);
  14.      
  15.         }
  16.  
  17.  
  18.  
  19.  
  20. public ArrayList<String> txtDocToSentence(String paragraph) {
  21.     // This option shows loading and sentence-segment and tokenizing
  22.     // a file using DocumentPreprocessor
  23.       ArrayList<String> sentenceList = new ArrayList<String>();
  24.  
  25.  
  26. Reader reader = new StringReader(paragraph);  
  27.     for (List<HasWord> sentence : new DocumentPreprocessor(reader)) {
  28.        
  29.     sentenceList.add(sentence.toString());  
  30.     }
  31.     return sentenceList;
  32.   }
  33.  
  34.    
  35. public ArrayList<String> pdfDocToSentence(byte[] buf ) throws IOException {
  36.  
  37.     PDFParser parser;
  38.     String parsedText;
  39.     PDFTextStripper pdfStripper;
  40.     PDDocument pdDoc = null ;
  41.     COSDocument cosDoc = null ;
  42.    
  43.         try {
  44.             parser = new PDFParser(new ByteArrayInputStream(buf));  
  45.            // parser = new PDFParser(new FileInputStream(f));
  46.         } catch (Exception e) {
  47.            // System.out.println("Unable to open PDF Parser.");
  48.             return null;
  49.         }
  50.         {
  51.         try {
  52.             parser.parse();
  53.             cosDoc = parser.getDocument();
  54.             pdfStripper = new PDFTextStripper();
  55.             pdDoc = new PDDocument(cosDoc);
  56.             parsedText = pdfStripper.getText(pdDoc);
  57.             //System.out.println("An exception occured in parsing the PDF Document.");
  58.         } catch (Exception e) {
  59.             try {
  60.                    if (cosDoc != null) cosDoc.close();
  61.                    if (pdDoc != null) pdDoc.close();
  62.                } catch (Exception e1) {
  63.             }
  64.             return null;
  65.         }
  66.        
  67.                                           finally{
  68.  Line-->(ControlerServelet.java:755)      cosDoc.close();
  69.                                            pdDoc.close();
  70.          }
  71.        
  72. }
  73.  
  74.  
  75.         if (parsedText == null) {
  76.          //System.out.println("PDF to Text Conversion failed.");
  77.         }
  78.        
  79.  
  80. return txtDocToSentence(parsedText);
  81.        
  82.     }

Revise this Paste
Parent: 47395
Your Name:
Code Language:
 
Security Image:
Text seen in Image:
Comments

Nothing has been added as yet. Post a comment.