官方釋出的基本設定

這個例子討論瞭如何從最新的官方版本中設定 CoreNLP。此示例將指導你下載程式包,並執行 CoreNLP 的簡單命令列呼叫。

先決條件:

  • Java JVM 8.命令 java -version 應該成功完成,如: java version“1.8.0_92”
  • Zip 工具
  • 例如:Bash 或類似的 shell,以及 wget

腳步:

  1. 下載 CoreNLP zip 檔案: http : //stanfordnlp.github.io/CoreNLP/index.html#download :

    wget http://nlp.stanford.edu/software/stanford-corenlp-full-2015-12-09.zip
    
  2. 解壓縮版本:

    unzip stanford-corenlp-full-2015-12-09.zip
    
  3. 輸入新解壓縮的目錄:

    cd stanford-corenlp-full-2015-12-09
    
  4. 設定類路徑。如果你使用的是 IDE,則應在 IDE 中設定類路徑。

    for file in `find . -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
    

    如果你經常使用 CoreNLP,這在你的~/.bashrc(或等效)檔案中有用,將目錄/path/to/corenlp/替換為解壓縮 CoreNLP 的相應路徑:

    for file in `find /path/to/corenlp/ -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
    
  5. 試試看! 例如,以下內容將生成一個簡單的文字檔案進行註釋,並在此檔案上執行 CoreNLP。輸出將作為 JSON 檔案儲存到 input.txt.out。請注意,CoreNLP 需要相當多的記憶體。在大多數情況下,你應該給它至少 2GB(-mx2g)。

    echo "the quick brown fox jumped over the lazy dog" > input.txt
    java -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -outputFormat json -file input.txt