AlchemyLanguage

AlchemyLanguage 是一組文字分析方法,可以更深入地瞭解你的文字或 HTML 內容。請參閱入門主題以瞭解如何開始使用 AlchemyLanguage 和其他 Watson 服務。有關 AlchemyLanguage 的更多詳細資訊和示例,請參閱 API 參考文件

尺寸限制

  • 文字清理前的 HTML 內容: 600 KB
  • 文字清理後的源文字: 50 KB
  • 使用自定義模型的呼叫: 5 KB

語言支援

要檢視每個函式支援哪些語言,請參閱 API 參考中的每個函式的條目。

語言檢測

預設情況下,AlchemyLanguage 會自動檢測源文字的語言。你可以使用 language 查​​詢引數手動指定內容的語言。 (例如 language=spanish

文字清理

當你使用 API​​的 HTML 或 URL 功能時,AlchemyLanguage 會清除內容以準備分析的源文字。sourceText 引數允許你使用以下選項自定義清潔過程:

  • cleaned_or_raw(預設) - 刪除網站元素,如連結,廣告等。如果清除失敗,則使用原始網頁文字
  • cleaned–刪除網站元素,如連結,廣告等。
  • raw - 使用原始網頁文字而不進行清理
  • cquery - 使用你在 cquery 引數中指定的視覺約束查詢。有關可視約束查詢的詳細資訊,請參閱文件
  • xpath - 使用你在 xpath 引數中指定的 XPath 查詢
  • xpath_or_raw - 使用 XPath 查詢的結果,如果 XPath 查詢沒有返回任何內容,則返回純文字
  • cleaned_and_xpath - 在已清理的網頁文字上使用 XPath 查詢的結果