セミナー情報
■2012年4月16日(月)13:30-15:00
- 題目
- 3D Urban Scene Understanding from Movable Platforms
- 場所
- 工学部14号館534号室
- 講師
Raquel Urtasun (Assistant Professor, Toyota Technological Institute at Chicago)
- 言語
- 英語
- 概要
Developing autonomous systems that are able to assist humans in everyday's tasks is one of the grand challenges in modern computer science. Notable examples are personal robotics for the elderly and people with disabilities, as well as autonomous driving systems which can help decrease fatalities caused by traffic accidents. In order to perform tasks such as navigation, recognition and manipulation of objects, these systems should be able to efficiently extract 3D knowledge of their environment. While a variety of novel sensors have been developed in the past few years, in this work we focus on the extraction of this knowledge from visual information alone. Unfortunately, existing approaches to 3D scene understanding either produce a mild level of understanding, e.g., segmentation, object detection, or are not accurate enough for these applications, e.g., 3D pop-ups. In this talk I will show generative models of 3D urban scenes that take into account dependencies between static and dynamic features, and are able to infer the geometric (e.g., street orientation) and topological (e.g., number of intersecting streets) properties of the scene layout, as well as the semantic activities occurring in the scene, e.g., traffic situations at an intersection, from monocular and stereo imagery. Furthermore, I will show that this global level of understanding provides the context necessary to disambiguate current state-of-the-art detectors.
This is joint work with Andreas Geiger, Martin Lauer and Christian Wojek.- Biography
- Raquel Urtasun is an Asssistant Professor at TTI-Chicago a philanthropically endowed academic institute located in the campus of the University of Chicago. She was a visiting professor at ETH Zurich during the spring semester of 2010. Previously, she was a postdoctoral research scientist at UC Berkeley and ICSI and a postdoctoral associate at the Computer Science and Artificial Intelligence Laboratory (CSAIL) at MIT. Raquel Urtasun completed her PhD at the Computer Vision Laboratory, at EPFL, Switzerland in 2006 working with Pascal Fua and David Fleet at the University of Toronto. She has been area chair of NIPS multiple times as well as UAI, and served in the committee of numerous international computer vision and machine learning conferences (e.g., CVPR, ICCV, ECCV, ICML, NIPS). Her major interests are statistical learning and computer vision, with a particular interest in non-parametric Bayesian statistics, latent variable models, structured prediction and their application to 3D scene understanding and human pose estimation.
開催済みのセミナー
■2012年3月14日(火)13:00-14:30
- 題目
- Matrix Learning: A Tale of Two Norms
- 場所
- 工学部6号館セミナー室AD
- 講師
Nathan Srebro (Associate Professor, Toyota Technological Institute at Chicago)
- 言語
- 英語
- 概要
- There has been much interest in recent years in various ways of constraining the complexity of matrices based on factorizations into a product of two simpler matrices. Such measures of matrix complexity can then be used as regularizers for such tasks as matrix completion, collaborative filtering, multi-task learning and multi-class learning. In this talk I will discuss two forms of matrix regularization which constrain the norm of the factorization, namely the trace-norm (aka nuclear-norm) and the so-called max-norm (aka $\gamma_2:\ell_1\rightarrow\ell_\infty$ norm). I will both argue that they are independently motivated and often better model data then rank constraints, as well as explore their relationships to the rank. In particular, I will discuss how simple low-rank matrix completion guarantees can be obtained using these measures, and without various "incoherence" assumptions. I will present both theoretical and empirical arguments for why the max-norm might actually be a better regularizer, as well as a better convex surrogate for the rank.
Based on joint work with Rina Foygel, Jason Lee, Ben Recht, Russ Salakhutdinov, Ohad Shamir, Adi Shraibman and Joel Tropp and others.
■2011年1月18日(火)16:00-18:00
- 題目
- データ解析が生む、新たなユーザー経験とビジネスの拡大(ゲーム業界編)
- 場所
- 工学部14号館534号室
- 講師
- ポリゴンマジック株式会社 代表取締役 鶴谷武親
- 言語
- 日本語
- 概要
- SNS、ソーシャルゲームの登場により、大量のネットユーザーログを分析し、コンテンツのPDCAサイクルにフィードバックする重要性が高まっています。世界最大のソーシャルアプリプロバイダーであるZynga社は、大量のデータマイニングエンジニアを抱え、コンテンツの最適化を行っています。いずれ、ユーザーログ・動線解析からコンテンツの最適化までを自動化する企業も現れることでしょう。残念ながら、日本では、手作業のログ解析・ユーザー動線分析が主流で、このままでは、Web3.0と呼ばれるソーシャルメディアの時代にも日本の活躍は見込めません。ソーシャルゲーム分野にいち早く参入した企業の経営者として、Web3.0におけるソーシャルゲームの持つ可能性と、データ解析技術に対する期待を語ります。
■2010年11月17日(水)13:00-15:00
- 題目
- Information-Theoretic Methods for Learning Bayesian Network Structures
- 場所
- 工学部14号館526号室
- 講師
- Petri Myllymaki (University of Helsinki)
- 言語
- 英語
- 概要
- Bayesian networks are popular probabilistic parametric models that are defined through acyclic directed graphs where the nodes represent the domain variables and the connecting edges define a set of conditional independence assumptions that restrict the set of probability distributions that can be represented by the model. We address the problem of learning such structures from data, and focus on the objective (non-informative) case where very little or no prior information is available about the domain the data is from. In this talk this problem is tackled by a scoring-based approach where the problem is split into two intertwined sub-tasks: the first task is to formulate a theoretically justifiable scoring function that defines a goodness criterion on the set of all possible Bayesian network structures, and the second task is to develop computationally feasible optimization algorithms that can find the optimal (or at least a good) model with respect to the selected goodness criterion. For solving the first task, we present an information-theoretic approach based on Rissanen’s Minimum Description Length (MDL) framework, and contrast it to the standard Bayesian approach based on the marginal likelihood criterion.
■2010年8月31日(火)11:00-12:30
- 題目
- Predicting drug-target interaction networks from the integration of chemical, genomic and pharmacological spaces
- 場所
工学部14号館534号室 [地図]
- 講師
- 言語
- 日本語
- 概要
- In silico prediction of drug-target interactions from heterogeneous biological data is critical in the search for drugs and therapeutic targets for known diseases such as cancers. In this study, we investigate the correlation between the chemical space of compound structures, the genomic space of genes/proteins, the pharmacological space of phenotypic effects, and the topology of drug-target interaction networks. We then develop a new method to predict unknown drug-target interactions from chemical, genomic, and pharmacological data on a large scale. The originality of the proposed method lies in the formalization of the drug-target interaction inference as a supervised learning problem for a bipartite graph, the lack of need for 3D structure information of the target proteins, and in the integration of chemical, genomic, and pharmacological spaces in a unified framework. In the results, we show the usefulness of the proposed method on the prediction for four classes of important drug-target interactions
■2010年7月27日(火)10:00-11:30
- 題目
- Non-parametric Kernel Learning: Algorithm and Applications
- 講師
- Dr. Ivor Tsang (Assistant Professor, Nanyang Technological University)
- 場所
- 東京大学 工学部14号館534号室
- 概要
- Non-Parametric Kernel Learning (NPKL) usually formulate the learning task as a Semi-Definite Programming (SDP) problem that is often solved by some general purpose SDP solvers. However, for N data examples, the time complexity of NPKL using a standard interior-point SDP solver could be as high as O(N^6.5), which prohibits NPKL methods applicable to real applications, even for datasets of moderate size. In this paper, we present a family of efficient NPKL algorithms, termed “SimpleNPKL”, which can learn non-parametric kernels from a large set of pairwise constraints efficiently. In particular, we propose two efficient SimpleNPKL algorithms. One is SimpleNPKL algorithm with linear loss, which enjoys a closed-form solution that can be efficiently computed by the Lanczos sparse eigen decomposition technique. Another one is SimpleNPKL algorithm with other loss functions (including square hinge loss, hinge loss, square loss) that can be re-formulated as a saddle-point optimization problem, which can be further resolved by a fast iterative algorithm. In contrast to the previous NPKL approaches, our empirical results show that the proposed new technique, maintaining the same accuracy, is significantly more efficient and scalable. Finally, we also demonstrate that the proposed new technique is also applicable to speed up many kernel learning tasks, including colored maximum variance unfolding, minimum volume embedding, and structure preserving embedding. Besides SimpleNPKL, we also propose a novel non-parametric spectral kernel learning method which can seamlessly combine manifold structure of unlabeled data and Regularized Least-Squares (RLS) to learn a new kernel. Interestingly, the new kernel matrix can be obtained analytically with the use of spectral decomposition of graph Laplacian matrix. Hence, the proposed algorithm does not require any numerical optimization solvers. Moreover, by maximizing kernel target alignment on labeled data, we can also learn model parameters automatically with a closed-form solution. For a given graph Laplacian matrix, our proposed method does not need to tune any model parameter including the tradeoff parameter in RLS and the balance parameter for unlabeled data. Extensive experiments on ten benchmark datasets show that our proposed non-parametric and parameter-free spectral kernel learning algorithm can obtain comparable performance with fine-tuned manifold regularization methods in transductive setting, and outperform multiple kernel learning in supervised setting.
■2010年2月24日(水)15:00-16:00
- 題目
- 経路のコスト推定問題について
- 講師
- 井手剛 (IBM東京基礎研究所)
- 場所
- 東京大学 工学部2号館 2階 セミナー室4
- 概要
- 空間を時系列的に移動する物体の軌跡、すなわちトラジェクトリに対するデータマイニングの問題は、実用的にも理論的にも興味深い研究テーマである。本講演では、ネットワーク上のトラジェクトリ(経路)のコスト予測問題についての最近の我々の研究成果を紹介する。経路のコスト推定問題の典型的な応用例は、任意経路に対する所要時間の予測問題である。講演ではまず、経路コスト予測問題を、カーネル回帰の枠組みで定式化する。次に、いわばその双対問題として別の定式化を導き、これら2つのアプローチの関係について論ずる。最後に、現実的な交通流のデータを用いて、我々の手法が、考えうる既存手法と比べて優れた予測性能を持つことを示す。
■2009年11月24日(火)13:45-14:45
- 題目
- ノンパラメトリックベイズ入門
- 講師
- 上田修功(NTTコミュニケーション科学基礎研究所)
- 場所
- 東京大学工学部6号館3階セミナー室A・D
- 概要
- 近年、機械学習の分野で、ベイズ統計を土台とする研究アプローチ が盛んである。特に、ノンパラメトリックベイズ(ディリクレ過程 混合モデル)に基づくモデル化が音声、画像、言語等のメディア処理に も応用されている。ディリクレ過程モデルの特長は、生成モデルの構造に関する事前知識を自然な形で事前分布に反映させている点に ある。これにより、例えば、クラスタリング応用では、学習時に、 クラスタ数を自動決定できる。本講演では、ベイズ統計の初学者 を想定し、ベイズモデルの基礎からディリクレ過程モデルの基礎、 およびその推論アルゴリズム、具体的な応用例について解説する。
■2009年11月18日(水)15:00-16:00
- 題目
- Hilbert space embeddings and metrics on probability measures
- 講師
- Bharath K Sriperumbudur (University of California, San Diego)
- 場所
- 東京大学工学部14号館 5階 534号室
- 概要
- In this talk, we will present a novel measure of distance between probability measuresobtained by embedding them into a reproducing kernel Hilbert space (RKHS), and computing the RKHS distance between these embeddings. We will examine the conditions on RKHS under which the embedding is injective so that it induces a metric on the space of probabilitymeasures. We will discuss some advantages of this distance measure over other well known distances like total variation distance, the Hellinger distance, the Kullback-Leibler divergence etc., especially in the context of statistical inference applications. Joint work with Arthur Gretton (Max Planck Institute for Biological Cybernetics, Tubingen),Kenji Fukumizu (Institute of Statistical Mathematics, Tokyo), Gert Lanckriet (UCSD) and Bernhard Scholkopf (Max Planck Institute for Biological Cybernetics, Tubingen).
■2009年11月10日 15:30-17:00
- 題目
- 回帰のための能動学習
- 講師
- 杉山 将(東京工業大学 計算工学専攻)
- 場所
- 東京大学工学部6号館3階セミナー室A・D
- 概要
- 能動学習は,入出力関係を学習する教師付き学習において,出力を観測すべき入力の場所を最適に決定する問題である.苦手な部分を集中的に勉強すると効 率よく 学習できるという直感ともよく合うことから,能動学習は近年盛んに研 究されている.回 帰問題(出力が連続値)における典型的な能動学習法では,手持ちの回帰モデルが正しい(すなわち,学習したい真の関数がモデルに含ま れている)と仮定している.しかし,このような仮定が現実的に成り立つことはめったになく,この仮定なしには良い汎化能力が得られなかった.本講演では,近年提案された回帰問題における新たな能動学習 法について説明する.この手法では,モデルが正しくない現実的な場面でも精度が理論 的に保証され,しかもアルゴリズムの簡便性は保たれている.半導体ウェハーの位置合わせ, 及び,ロボット制御に適用した実例も紹介する.
■2009年11月6日 13:00‐14:30
- 題目
- Estimating location and connectivity structure of brain sources from external measurements
- 講師
- Stefan Haufe (Technical University of Berlin)
- 場所
- 東京大学工学部14号館 5階 534号室
- 概要
- Electroencephalography (EEG) is a widely used technique for measuring brain signals. Its advantages are portability, low costs, high temporal resolution and its noninvasive character. The latter property, however, causes EEG sensors to measure rather mixtures of signals than activity of isolated sources (due to volume conduction in the head). Many EEG analyses are hampered by this mixing, the most interesting probably being the localization of the underlying sources in the brain and the estimation of brain connectivity. In this talk we present our research on both topics. Our ideas will be demonstrated using appropriate examples and results on data Brain-computer interfacing sessions will be shown.
■ 2009年10月19日 15:00‐17:00
- 題目
- Finding Stationary Subspaces in Multivariate Time Series
- 講師
- Frank Meinecke (Technical University of Berlin)
- 場所
- 東京大学工学部6号館3階セミナー室A・D
- 概要
- Identifying temporally invariant components in complex multivariate time series is key to understand the underlying dynamical system and predict its future behaviour. In this talk I will present a novel technique, Stationary Subspace Analysis (SSA), that decomposes a multivariate timeseries into a stationary and a non-stationary part. After deriving the method, I will characterize the basic properties of SSA both theoretically and in controlled simulations. In an application to cortical signals measured by electroencephalography, I show how SSA can be used to boost the performance of a Brain-Computer- Interface (BCI).
■ 2009年10月13日 15:00‐17:00
- 題目
- Learning to Rank: Current Status, Challenges, and Opportunities
- 講師
- Hang Li (Microsoft Research Asia)
- 場所
- 東京大学工学部6号館3階セミナー室A・D
- 概要
- Learning to rank is an area in machine learning which is concerned with automatically constructing a ranking model using training data. Learning to rank has been successfully applied to information retrieval and other fields, and is attracting more and more attention recently. In this talk I will first give a formulation of learning to rank, and explain its relations with other learning tasks. I will then introduce several learning to rank methods which we have developed in recent years. Finally, I will present challenges and opportunities of learning to rank research.
■ 2009年2月24日 13:00-14:30
- 題目
- 機械論的学習理論とデータマイニングへの応用 基礎から事業化まで
- 講師
- 山西健司
- 場所
- 東京大学工学部6号館3階セミナー室A・D
- 概要
- 大量のデータからデータの生成メカニズムを推定し、埋もれた知識を発見する営みを機械学習とよぶ。本講演では、情報理論におけるデータ圧縮の立場から統一的に機械学習の アルゴリズムの設計と解析にアプローチする「情報論的学習理論」の体系について概説する。 そこでは、「確率的コンプレキシティ」と呼ばれる統計概念が中心的役割を果たす。確率的コンプレキシティおよびその様々な拡張を通じて有効な学習アルゴリズムが生まれ、それが真に学習 の本質に結びついていることを概括する。さらに、学習理論の結果を現実のデータマイニングの 問題、特に異常検知やテキストマイニングに適用した事例を示す。異常検出では、情報犯罪の検 出・システム障害検出などに、テキストマイニングでは、自由記述アンケート分析 CGM(Consumer Generated Media)分析などに実際に機械学習理論を活用してきた。その現実への適用の魅力と事業展開の難しさなどについて紹介したい。
■ 2009年1月16日 13:00‐14:30
- 題目
- 構造データの機械学習
- 講師
- 鹿島久嗣(IBM東京基礎研究所)
- 場所
- 東京大学工学部6号館3階セミナー室A・D
- 概要
- この講演では、構造(とくに、グラフ構造)をもったデータを解析するための機械学習手法を紹介する。前半では、化合物やHTML文書などのように、データの「内側」に構造があるような場合を扱うためのアプローチを紹介する。構造データなどの 標準的ではないデータを扱うためのアプローチとしては、「カーネル関数」とよばれる 2つのデータの間の類似度を、学習アルゴリズムとは切り離して設計することができる 「カーネル法」と呼ばれる便利な枠組みが知られている。ここでは、木やグラフなどの 内部構造をもったデータに対して、その構造的特徴をうまく捉えながら、かつ、効率的に計算することのできるカーネル関数を紹介する。後半では、ソーシャルネットワークや生体ネットワークなどのようにデータの「外側」に構造があるような場合を扱うための アプローチを紹介する。特に、ここでは、応用上重要な、ネットワーク構造を予測する問題を取り上げ、これを、任意の2つのデータの間の複数種類の関係を予測する問題 として捉える。この問題に対して、カーネル法などのアプローチを用いようとすると、デ ータのペア同士の類似度を取り扱う必要があるが、これは非常に巨大であり、そのまま扱うことは現実的でない。ここでは、この問題を回避し、データ間の関係の予測を効率的に行う方法を紹介する。