Audio Spectrogram Transformerの解説と実験

こんにちは,リサーチャーの二階堂です.NLP界隈では必須級の扱いとなっているTransformerベースのモデルですが,昨今画像処理や物体検出分野における活躍も目を見張るものがあります.そんな中,音データにおけるクラス分 …

深層学習の設計からサーチへ!

こんにちは.R&Dセンターに所属している研究員の星野です.今回は社内の10%ルールの中で個人的に取り組んだ開発事例の一つであるアーキテクチャサーチを紹介します.10%ルールは、社員が好きなテーマを選び自己啓発や技 …

生体音の解析について

今回は、前回までとは趣向を変えて、生体音(心臓・肺などの音)の解析について紹介します。 生体音を解析すると何ができるのか 1816年にフランス人医師ルネ・ラエンネックによって聴診器が発明されて以来、聴診器を使った病気の診 …

擬似異常音をつくろう

 こんにちは.R&Dセンターに所属しているリサーチャーの山口です.今回は擬似的な異常音を作る方法を紹介します. 異音検知の問題点  異音検知の性能を評価するには正常音のデータと異常音のデータが必要です. 現実では …

Nearest Neighborフィルターによるアナウンス音の分離

R&Dセンターの豊田です。今回はNearest Neighbor filter(NNF)を用いて、スーパーマーケットの閉店を模擬したアナウンスを背景音の蛍の光から分離します。 概要 閉店間際の夜のスーパーマーケッ …

音響特徴量「メルスペクトル」と「MFCC(メル周波数ケプストラム係数)」の解説と実例紹介

R&Dセンターの筒井です。本記事では、音声認識や音響分析にあまり馴染みがない方に向けて、実例を交えて音響特徴量を解説したいと思います。 音響特徴量とは?ですが、単純に、収音した音データ(信号波形)をモデルに入力し …

Streamlitを用いた音データ可視化アプリの作成

こんにちは.リサーチャーの二階堂です.今回はpythonのみでwebアプリケーションを作成できる「Streamlit」というフレームワークを紹介します. また,Streamlitを用いて音データ可視化アプリケーションを作 …

ラウドネスについて

今回は人間の音の認知に関わる,ラウドネスに関するお話をさせていただきたいと思います.