AlchemyLanguage

AlchemyLanguage 是一组文本分析方法,可以更深入地了解你的文本或 HTML 内容。请参阅入门主题以了解如何开始使用 AlchemyLanguage 和其他 Watson 服务。有关 AlchemyLanguage 的更多详细信息和示例,请参阅 API 参考文档

尺寸限制

  • 文本清理前的 HTML 内容: 600 KB
  • 文本清理后的源文本: 50 KB
  • 使用自定义模型的调用: 5 KB

语言支持

要查看每个函数支持哪些语言,请参阅 API 参考中的每个函数的条目。

语言检测

默认情况下,AlchemyLanguage 会自动检测源文本的语言。你可以使用 language 查​​询参数手动指定内容的语言。 (例如 language=spanish

文字清理

当你使用 API​​的 HTML 或 URL 功能时,AlchemyLanguage 会清除内容以准备分析的源文本。sourceText 参数允许你使用以下选项自定义清洁过程:

  • cleaned_or_raw(默认) - 删除网站元素,如链接,广告等。如果清除失败,则使用原始网页文本
  • cleaned–删除网站元素,如链接,广告等。
  • raw - 使用原始网页文本而不进行清理
  • cquery - 使用你在 cquery 参数中指定的视觉约束查询。有关可视约束查询的详细信息,请参阅文档
  • xpath - 使用你在 xpath 参数中指定的 XPath 查询
  • xpath_or_raw - 使用 XPath 查询的结果,如果 XPath 查询没有返回任何内容,则返回纯文本
  • cleaned_and_xpath - 在已清理的网页文本上使用 XPath 查询的结果