Webアプリケーション開発
モバイルアプリケーション開発
新規事業開発
先進技術研究
UX/UIデザイン
XR
ブロックチェーン
Nablarch
Lerna
量子コンピュータ
アジャイル・スクラム
要件定義
開発プロセス
ソフトウェアテスティング
環境構築・ログ・CI/ CD
セキュリティ・暗号化
エンジニア育成・学習
活動発信・イベントレポート
その他
https://fintan.jp $ ls -a
カテゴリ
お知らせ
私たちについて
お問い合せ
TIS株式会社 先進技術研究チームが取り組む研究に関する活動・レポートをご紹介します。
背景 質問応答システムとは、日本語や英語のような自然言語で表現された質問に対して、適切な回答をするシステムを指しています。たとえば、質問応答システムに対して「富士山の高さはどのくらいですか?」という質問をしたとしましょう。この場合、システムには「3776m」という回答を提示することが期待されます。 質問応答システ…
はじめに 本記事では、集めてきた情報を「知識」として表すための技術である知識グラフ(Knowledge Graph)について解説します。はじめに、知識グラフとその応用について説明することで、知識グラフとはどのようなもので、何の役に立つのか理解します。次に、知識グラフの構築方法について解説します。ここでは、固有表現認識、…
背景 固有表現認識は、テキストに出現する人名や地名などの固有名詞や、日付や時間などの数値表現を認識する技術です。固有表現認識は、質問応答システム、対話システム、情報抽出といった自然言語処理を用いた応用アプリケーションの要素技術としても使われています。 具体例を見てみましょう。以下の文から固有表現を認識してみます。…
概要 こんにちは。戦略技術センターで自然言語処理関係の研究開発をしている中山です。普段はアノテーションツールdoccanoの開発をしています。過去には研究成果の発信の一環として機械学習や自然言語処理の書籍の執筆も行っています。 【訳書】直感 Deep Learning 【単著】機械学習・深層学習による自…
概要 VirtualCollaboBaseとはVR遠隔コラボレーションツールのベースとなるシステムです。 OculusQuestで5人程度が同じルームに入っての会話をしたり、付箋やホワイトボードを使いアイデア出しなどが行えます。 詳細ページ https://github.com/tech-sketc…
はじめに ChatGPTやGPT-4をはじめとする大規模言語モデル(LLM)の能力が大幅に向上し、自然言語処理の分野で多くの注目を集めています。これらのLLMは、さまざまな自然言語処理タスクにおいて、タスクに固有な学習データを用いてモデルをファインチューニングすることなく、推論時にタスクの説明といくつかの例を見せるだけ…
はじめに ChatGPTやGPT-4をはじめとする大規模言語モデルの能力が大幅に向上し、自然言語処理の分野で多くの注目を集めています。これらのモデルを使うことで、今までは複雑な処理が必要だった質問応答や要約などのアプリを以前と比べて簡単に作り始められるようになりました。その使い方の例としては、社内にあるFAQや回答事例…
はじめに こんにちは、戦略技術センターでActive Learningの研究に取り組んでいる梁です。本記事では、弊社が開発した画像セグメンテーション (以下セグメンテーション) 用のActive Learningツール、SegALについて紹介します。 本記事の内容は、以下のとおりです。 セグメンテーショ…
はじめに TIS株式会社、戦略技術センター所属の井出です。2017年から戦略技術センターでXRの研究開発を行っています。 本記事ではTISと東京都市大学で共同研究を行っているVR空間でのコミュニケーションに関する研究を紹介します。 VR空間でのコミュニケーション研究はTISと東京都市大学市野研究室の共同研究、及…
はじめに 戦略技術センターでActive Learningの研究に取り組んでいる梁です。本記事では、画像セグメンテーション (以下セグメンテーション) のアノテーションを効率化する方法の1つであるActive Learningについて紹介します。具体的には、セグメンテーションにおけるActive Learningの研究…
はじめに 戦略技術センターでデータアノテーションの研究開発をしている谷口です。この記事では、画像セグメンテーションのアノテーションを効率化する方法について紹介します。 具体的には、SuperpixelセグメンテーションとInteractiveセグメンテーションについて、それらの効果とメリット・デメリットを紹介します。 …
はじめに こんにちは。 戦略技術センターの梁です。 ラベル付け対象のデータ量を減らす技術であるActive Learningに取り組んでいます。 Active Learningは少ないデータ量で高い性能を達成するための技術として、画像処理や自然言語処理のタスクに使われています。最近のActive Learningの研…
はじめに こんにちは。 戦略技術センター (STC) の梁です。 ラベル付け対象のデータ量を減らす技術であるActive Learningに取り組んでいます。 Active Learningは様々なタスクに使われています。今回は固有表現認識の文脈で研究成果を共有します。内容としては、以下のとおりです。 …
はじめに 戦略技術センター (STC) で自然言語処理関係の研究開発をしている谷口です。この記事では、部分的アノテーションを用いた固有表現認識モデルについて得られた知見を紹介します。 今回は、辞書データから作成したデータセットに対する固有表現認識モデルの評価を行いました。 概要 固有表現認識 固有表現認識は、所…
はじめに こんにちは。戦略技術センターの梁です。 私が所属している自然言語処理チームでは、機械学習用データのアノテーションに関する研究開発をしています。その中でも私は、ラベル付け対象のデータ量を減らす技術であるActive Learningに取り組んでいます。 Active Learningのツールは多数あ…
はじめに 戦略技術センター (STC) で自然言語処理関係の研究開発をしている谷口です。本記事では、我々が開発したseqlabelの紹介をします。seqlabelは辞書データから固有表現認識用のデータセットを自動構築するためのライブラリです。ライブラリを実装するに至った背景、既存ライブラリの課題等を説明します。また簡単…
はじめに こんにちは。戦略技術センターの梁です。 私が所属している自然言語処理チームでは、機械学習用データのアノテーションに関する研究開発をしています。その中でも私は、ラベル付け対象のデータ量を減らす技術であるActive Learningに取り組んでいます。 Active Learning自体はさまざまな…
はじめに TIS株式会社、戦略技術センター所属の芳木です。 本記事では、今年3月17日に開催された「XRミーティング」での対外発表「脳波センサーをつかってみた」のご紹介をさせていただきます。 イベントURL:https://connpass.com/event/206670/ 発表の内容 発表では下記画…
はじめに 戦略技術センターで自然言語処理関係の研究開発をしている谷口です。普段はText-to-SQLの研究をしています。 本記事では、説明可能なAI (Explainable AI; XAI) について解説します。はじめに、XAIの必要性について解説します。次に、XAIの代表的な3つのアプローチ、XAIのアプリ…
戦略技術センター (STC) で自然言語処理関係の研究開発をしている谷口です。 本記事では、STCで行った「Text-to-SQL」研究の成果である以下の論文について紹介します。 An Investigation Between Schema Linking and Text-to-SQL Perform…
はじめに こんにちは。戦略技術センターで自然言語処理関係の研究開発をしている中山です。普段はアノテーションツールdoccanoの開発をしています。 過去には研究成果の発信の一環として機械学習や自然言語処理の書籍の執筆も行っています。 【訳書】直感 Deep Learning 【単著】機械学習・深層学習に…
はじめに TIS株式会社、戦略技術センター所属の清家です。 本記事ではTISの研究開発部門である戦略技術センターが現在参画している以下の取り組みのご紹介をさせていただきます。 TIS、東京都の「AIとIoTにより認知症高齢者問題の解決を目指す研究」に参画 ~ 新しいセンサーネットワーク通信を研究開発 ~ …
はじめに こんにちは。戦略技術センターの梁です。TIS入社3年目です。現在、自然言語処理の研究をやっています。 2020年3月末までの研究活動として、企業名のカバレージと表記ゆれを考慮した大規模企業名辞書「JCLdic」を作り上げました。 今回は「JCLdic」を作った経緯と辞書の使い方を紹介します。 背景 金…