<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>NLP on Grayrecord Technow Blog</title>
    <link>https://technow.grayrecord.com/tags/nlp/</link>
    <description>Recent content in NLP on Grayrecord Technow Blog</description>
    <image>
      <title>Grayrecord Technow Blog</title>
      <url>https://technow.grayrecord.com/images/Grayrecord-technow.png</url>
      <link>https://technow.grayrecord.com/images/Grayrecord-technow.png</link>
    </image>
    <generator>Hugo -- 0.161.1</generator>
    <language>ja</language>
    <lastBuildDate>Mon, 22 Dec 2025 11:40:42 +0900</lastBuildDate>
    <atom:link href="https://technow.grayrecord.com/tags/nlp/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>System Requirements Dataset: AIモデルとデータセットの探求</title>
      <link>https://technow.grayrecord.com/post/system-requirements-dataset/</link>
      <pubDate>Mon, 22 Dec 2025 11:40:42 +0900</pubDate>
      <guid>https://technow.grayrecord.com/post/system-requirements-dataset/</guid>
      <description>&lt;p&gt;AIモデルの性能評価や、新しいアルゴリズム（例えば以前取り上げたSVG: Support Vector Generationなど）の実験において、適切なデータセットの選定は極めて重要です。今回は、私がソフトウェアエンジニアリング領域の自然言語処理（NLP）タスクでベンチマークとして愛用している「PROMISE Dataset」について、その構造とAIモデルでの活用実験の経験を交えて紹介します。&lt;/p&gt;
&lt;h2 id=&#34;promise-datasetとは&#34;&gt;PROMISE Datasetとは&lt;/h2&gt;
&lt;p&gt;私がよく利用しているのは、&lt;a href=&#34;https://github.com/mahdikabootari/Software-Requirements-Classification&#34;&gt;Software-Requirements-Classification&lt;/a&gt; リポジトリに含まれている &lt;code&gt;PROMISE.CSV&lt;/code&gt; です。&lt;/p&gt;
&lt;p&gt;元々は &lt;a href=&#34;http://promise.site.uottawa.ca/SERepository/&#34;&gt;PROMISE Software Engineering Repository&lt;/a&gt; で公開されていたもので、ソフトウェア要件定義書のテキストデータと、それが「機能要件」か「非機能要件」か、さらに細かい分類ラベルが付与されたデータセットです。&lt;/p&gt;
&lt;h3 id=&#34;データの構造とクラス定義&#34;&gt;データの構造とクラス定義&lt;/h3&gt;
&lt;p&gt;このデータセットは主に以下の構成になっています。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;Project ID&lt;/strong&gt;: プロジェクトの識別子&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Requirement Text&lt;/strong&gt;: 要件のテキスト（例: &amp;ldquo;The system shall refresh the display every 60 seconds.&amp;quot;）&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Class&lt;/strong&gt;: 要件の分類クラス&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;クラス分類は以下の4つが主要なラベルとして使用されています。これらは要件エンジニアリングにおける古典的な分類に基づいています。&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;F (Functional Requirement)&lt;/strong&gt;: 機能要件。システムが「何を」するか。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;PE (Performance)&lt;/strong&gt;: 性能要件。非機能要件の一種。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;LF (Look-and-Feel)&lt;/strong&gt;: 外観・操作感。UI/UXに関わる非機能要件。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;US (Usability)&lt;/strong&gt;: 使用性。使いやすさに関わる非機能要件。&lt;/li&gt;
&lt;/ol&gt;
&lt;div class=&#34;mermaid&#34; align=&#34;center&#34;&gt;
    
graph TD
    Req[Software Requirement]
    Req --&gt; F[Functional (F)]
    Req --&gt; NF[Non-Functional]
    NF --&gt; PE[Performance (PE)]
    NF --&gt; LF[Look-and-Feel (LF)]
    NF --&gt; US[Usability (US)]
    NF --&gt; Other[Other NFRs...]

&lt;/div&gt;

&lt;h2 id=&#34;aiモデルによる実験llm-vs-svg&#34;&gt;AIモデルによる実験：LLM vs SVG&lt;/h2&gt;
&lt;p&gt;私はこのデータセットを用いて、いくつかのAIモデルのアプローチを試みてきました。&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
