

#NLP のタグが付いた記事一覧
-
NEW
先進技術研究
データ作成に使うActive Learningの時間と性能を両立するベストプラクティス
はじめに こんにちは。 戦略技術センターの梁です。 ラベル付け対象のデータ量を減らす技術であるActive Learningに取り組んでいます。 Active Learningは少ないデータ量で高い性能を達成するための技術として、画像処理や自然言語処理のタスクに使われています。最近のActive Learningの研…
NEW先進技術研究
データ作成に使うActive Learningの時間と性能を両立するベストプラクティス
-
NEW
先進技術研究
自然言語処理のデータ作成に使うActive Learningのサンプリング方法を改善する -固有表現認識編-
はじめに こんにちは。 戦略技術センター (STC) の梁です。 ラベル付け対象のデータ量を減らす技術であるActive Learningに取り組んでいます。 Active Learningは様々なタスクに使われています。今回は固有表現認識の文脈で研究成果を共有します。内容としては、以下のとおりです。 …
NEW先進技術研究
自然言語処理のデータ作成に使うActive Learningのサンプリング方法を改善する -固有表現認識編-
- #NLP
-
NEW
先進技術研究
部分的アノテーションを用いた固有表現認識モデルの評価
はじめに 戦略技術センター (STC) で自然言語処理関係の研究開発をしている谷口です。この記事では、部分的アノテーションを用いた固有表現認識モデルについて得られた知見を紹介します。 今回は、辞書データから作成したデータセットに対する固有表現認識モデルの評価を行いました。 概要 固有表現認識 固有表現認識は、所…
NEW先進技術研究
部分的アノテーションを用いた固有表現認識モデルの評価
- #NLP
-
先進技術研究
SeqAL: 系列ラベリング用のActive Learningツール
はじめに こんにちは。戦略技術センターの梁です。 私が所属している自然言語処理チームでは、機械学習用データのアノテーションに関する研究開発をしています。その中でも私は、ラベル付け対象のデータ量を減らす技術であるActive Learningに取り組んでいます。 Active Learningのツールは多数あ…
先進技術研究
SeqAL: 系列ラベリング用のActive Learningツール
-
先進技術研究
辞書ベース固有表現認識ライブラリseqlabelの公開
はじめに 戦略技術センター (STC) で自然言語処理関係の研究開発をしている谷口です。本記事では、我々が開発したseqlabelの紹介をします。seqlabelは辞書データから固有表現認識用のデータセットを自動構築するためのライブラリです。ライブラリを実装するに至った背景、既存ライブラリの課題等を説明します。また簡単…
先進技術研究
辞書ベース固有表現認識ライブラリseqlabelの公開
-
先進技術研究
データ拡張と言語的特徴を用いた固有表現認識の性能改善
概要 こんにちは。戦略技術センターで自然言語処理関係の研究開発をしている中山です。普段はアノテーションツールdoccanoの開発をしています。過去には研究成果の発信の一環として機械学習や自然言語処理の書籍の執筆も行っています。 【訳書】直感 Deep Learning 【単著】機械学習・深層学習による自…
先進技術研究
データ拡張と言語的特徴を用いた固有表現認識の性能改善
- #NLP
-
先進技術研究
系列ラベリングにおけるActive Learning
はじめに こんにちは。戦略技術センターの梁です。 私が所属している自然言語処理チームでは、機械学習用データのアノテーションに関する研究開発をしています。その中でも私は、ラベル付け対象のデータ量を減らす技術であるActive Learningに取り組んでいます。 Active Learning自体はさまざまな…
先進技術研究
系列ラベリングにおけるActive Learning
-
先進技術研究
Explainable AIに関する技術動向
はじめに 戦略技術センターで自然言語処理関係の研究開発をしている谷口です。普段はText-to-SQLの研究をしています。 本記事では、説明可能なAI (Explainable AI; XAI) について解説します。はじめに、XAIの必要性について解説します。次に、XAIの代表的な3つのアプローチ、XAIのアプリ…
先進技術研究
Explainable AIに関する技術動向
-
先進技術研究
Text-to-SQLのニューラルモデルにおける解釈性向上
戦略技術センター (STC) で自然言語処理関係の研究開発をしている谷口です。 本記事では、STCで行った「Text-to-SQL」研究の成果である以下の論文について紹介します。 An Investigation Between Schema Linking and Text-to-SQL Perform…
先進技術研究
Text-to-SQLのニューラルモデルにおける解釈性向上
-
先進技術研究
自然言語処理における言語モデルのトレンドとアプリケーション
はじめに こんにちは。戦略技術センターで自然言語処理関係の研究開発をしている中山です。普段はアノテーションツールdoccanoの開発をしています。 過去には研究成果の発信の一環として機械学習や自然言語処理の書籍の執筆も行っています。 【訳書】直感 Deep Learning 【単著】機械学習・深層学習に…
先進技術研究
自然言語処理における言語モデルのトレンドとアプリケーション
-
先進技術研究
知識グラフの要素技術とアプリケーション
はじめに 本記事では、集めてきた情報を「知識」として表すための技術である知識グラフ(Knowledge Graph)について解説します。はじめに、知識グラフとその応用について説明することで、知識グラフとはどのようなもので、何の役に立つのか理解します。次に、知識グラフの構築方法について解説します。ここでは、固有表現認識、…
先進技術研究
知識グラフの要素技術とアプリケーション
- #NLP
-
先進技術研究
質問応答システムを支える技術〜ナレッジを引き出し、活用しよう〜
背景 質問応答システムとは、日本語や英語のような自然言語で表現された質問に対して、適切な回答をするシステムを指しています。たとえば、質問応答システムに対して「富士山の高さはどのくらいですか?」という質問をしたとしましょう。この場合、システムには「3776m」という回答を提示することが期待されます。 質問応答システ…
先進技術研究
質問応答システムを支える技術〜ナレッジを引き出し、活用しよう〜
- #NLP
-
先進技術研究
テキストの構造化を支える技術 固有表現認識編
背景 固有表現認識は、テキストに出現する人名や地名などの固有名詞や、日付や時間などの数値表現を認識する技術です。固有表現認識は、質問応答システム、対話システム、情報抽出といった自然言語処理を用いた応用アプリケーションの要素技術としても使われています。 具体例を見てみましょう。以下の文から固有表現を認識してみます。…
先進技術研究
テキストの構造化を支える技術 固有表現認識編
- #NLP
-
先進技術研究
大規模企業名辞書「JCLdic」で企業名を認識する
はじめに こんにちは。戦略技術センターの梁です。TIS入社3年目です。現在、自然言語処理の研究をやっています。 2020年3月末までの研究活動として、企業名のカバレージと表記ゆれを考慮した大規模企業名辞書「JCLdic」を作り上げました。 今回は「JCLdic」を作った経緯と辞書の使い方を紹介します。 背景 金…
先進技術研究
大規模企業名辞書「JCLdic」で企業名を認識する
- #NLP
/* News */ お知らせ
-
データ作成に使うActive Learningの時間と性能を両立するベストプラクティスを公開しました。
-
ECSでGitHub Actionsのセルフホストrunnerを動かすを公開しました。
-
新規事業開発のためのステージ・ゲートプロセスを更新しました。
-
量子近似最適化アルゴリズム(QAOA)におけるゲート操作と量子アニーリングを公開しました。
-
360度カメラとUnityで作ったバーチャル空間の舞台裏を公開しました。
-
配色が苦手なエンジニア向け配色実践講座を公開しました。
-
性能テスト計画書サンプルを公開しました。
-
自然言語処理のデータ作成に使うActive Learningのサンプリング方法を改善する -固有表現認識編-を公開しました。
-
テスト種別&テスト観点カタログを更新しました。
-
性能テスト計画ガイドを公開しました。
-
新規事業開発のためのステージ・ゲートプロセスを公開しました。
-
React Nativeのサンプルアプリケーションを更新しました。
/* About Fintan */ Fintanとは
Fintanは、TISインテックグループのノウハウを集約したサイトです。
研究成果や、PJ推進のプラクティス、要件定義/設計/プログラミング/テストといった作業のプラクティス、
成果物のテンプレート/サンプル、各種開発ツールを提供します。
Fintanは、どなたでも無償でご利用いただけます。