到Big Long River(225英里)游玩的游客可以享受那里的风景和振奋人心的急流。远足者没法到达这条河,唯一去的办法是漂流过去。这需要几天的露营。河流旅行始于First Launch,在 Final Exit结束,共225英里的顺流。旅客可以选择依靠船桨来前进的橡皮筏,它的速度是4英里每小时,或者选择8英里每小时的摩托船。旅行从开始到结束包括大约6到18个晚上的河中的露营。负责管理这条河的政府部门希望让每次旅行都能尽情享受野外经历,同时能尽量少的与河中其他的船只相遇。当前,每年经过Big Long河的游客有X组,这些漂流都在一个为期6个月时期内进行,一年中的其他月份非常冷,不会有漂流。在Big Long上有Y处露营地点,平均分布于河廊。随着漂流人数的增加,管理者被要求应该允许让更多的船只漂流。他们要决定如何来安排最优的方案:包括旅行时间(以在河上的夜晚数计算)、选择哪种船(摩托还是桨船),从而能够最好地利用河中的露营地。换句话说,Big Long River在漂流季节还能增加多少漂流旅行数?管理者希望你能给他们最好的建议,告诉他们如何决定河流的容纳量,记住任两组旅行队都不能同时占据河中的露营地。此外,在你的摘要表一页,准备一页给管理者的备忘录,用来描述你的关键发现。
破案模型
您的组织,ICM正在调查一个作案阴谋。调查者非常有信心,因为他们知道阴谋集团的几名成员,但他们希望在进行逮捕之前能找出其他成员和领导人。主谋者和所有可能涉嫌同谋的人都以复杂的关系为同一家公司在一个大办公室工作。 这家公司一直快速增长,并在开发和销售适用于银行和信用卡公司的计算机软件方面打出了自己的名气。 ICM最近从一个82个工人的小集体那儿得知了一个消息,他们认为这个消息能将帮助他们在公司里找到目前身份尚不明确的同谋者和未知的领导人的最有可能的人选。由于信息流通涉及到所有的在该公司工作的工人,所以很可能在这次信息流通中有一些(或许很多)已经确定的传播者实际并不涉及阴谋。事实上,他们确定他们知道一些并不参与阴谋的人。
建模工作的目标是确定在这个复杂的办公室里谁是最有可能的同谋。
一个优先级列表是最理想的,因为ICM可以根据这个来调查,**,和/或询问最有可能的候选人。
一个划分非同谋者与同谋者的分割线也将是有益的,因为可以对每个组里的人进行清楚的分类。
如果能提名阴谋的领导人,那对于检察官办公室也是非常有帮助的。
在把当前情况下的数据给你的犯罪建模团队之前,你的上司给你以下情形(称为调查EZ),那是她几年前在另一座城市工作时的案例。她对她在简单案件的工作非常自豪,她说,这是一个非常小的,简单的例子,但它可以帮助你了解自己的任务。
她的数据如下:
她认为是同谋的十人分别为Anne#, Bob, Carol, Dave*, Ellen, Fred, George*, Harry, Inez, and Jaye#.(*表示之前已知的同谋,#表示事先已知的非同谋者)
她对她的案件的28个消息记录按照她的分析 依据主题进行了编号。
Anne to Bob:你今天为什么迟到了? (1)
Bob to Carol:这该死的Anne总是看着我。我并没有迟到。 (1)
Carol to Dave: Anne 和 Bob又再为Bob的迟到吵架了。 (1)
Dave to Ellen:我今天早上要见你。你什么时候能来?把预算文件顺便带过来。 (2)
Dave to Fred:我今天随时随地都可以去见你。让我知道什么时候比较好。我需要带预算文件吗? (2)
Dave to George:我待会见你---有很多需要谈的。我希望其他人都准备好。获得这项权利? 很重要。 (3)
Harry to George:你似乎很紧张。怎么回事?不用担心,我们的预算会好的。 (2)(4)
Inez to George:我今天真的很累。你呢,还好吗? (5)
Jaye to Inez:也不怎么样今天(?)。今天一起去吃午饭怎么样? (5)
Inez to Jaye:幸好一切都很平静。我已经精疲力竭,不能做午饭了今天。抱歉! (5)
George to Dave:现在来见我! (3)
Jaye to Anne:你去吃午饭吗今天? (5)
Dave to George:我没法去,现在正要去见Fred。 (3)
George to Dave:见完他后到我这来。(3)
Anne to Carol:谁来监督一下Bob?他整天游手好闲的。(1)
Carol to Anne:别管他。他和George and Dave合作得很好。(1)
George to Dave:这个很重要。该死的Fred。Ellen怎么样了? (3)
Ellen to George:你和Dave谈过了吗?(3)
George to Ellen:还没。你呢?(3)
Bob to Anne:我没有迟到。而且你知道我午饭时间都在工作呢。(1)
Bob to Dave:告诉他们我没有迟到。你了解我的。(1)
Ellen to Carol:联系Anne安排下个星期的预算会议日程,还有,帮我让George冷静点。(2)
Harry to Dave:你有没有注意到George今天看上去又很紧张/有压力?(4)
Dave to George:该死的Harry觉得你很紧张。别让他担心,免得他四处打探。(4)
George to Harry:我只是工作得太晚,家里又有点问题。不用担心,我很好。(4)
Ellen to Harry:我忘了今天的会议了,怎么办?Fred会在那的,而且他比我更了解预算。(2)
Harry to Fred:我觉得明年的预算会让一些人很有压力的。或许你今天该花点时间让大家安心。(2)(4)
Fred to Harry:我觉得我们的预算很正常,我没觉得会有人感到有压力。(2)
通信记录结束。
你的上司指出,她只分配和编号了5个不同的消息主题:
1)Bob的迟到,
2)预算,
3)重要的未知的问题,可能是阴谋,
4)乔治的压力,
5)午餐和其他社会问题。
正如看到的消息编码那样,一些消息根据内容有两个主题。
你的上司按照通信联系和消息类型构造的通信网络分析案件。下图是一个消息网络模型,网络图上注明了消息类型的代码。
您的上司说,除了已知的同谋George and Dave之外,根据她的分析 Ellen and Carol也被认为是同谋。而且不久后,Bob招认出他确实参与其中,从而希望得到减刑。而对Carol的控告后来被放弃了。
你的上司至今仍然相当肯定Inez也参与了,但却从未对她立案。
你的上司建议您的团队,确定有罪的当事人,使像Inez的人不漏网,像Carol的人不被诬陷,从而增加ICM的信用,使像Bob的人不再有获得减刑的机会。
现在的案件:
你的上司已经把目前的情况下构造成网络状的数据库,它具有和上面相同的结构,只是范围较大。调查者有一些线索表明,一个阴谋正在挪用公司的资金和使用网上诈骗盗窃在该公司做业务的顾客的信用卡资金。
她给你看的简单案件的小例子,只有10个人(节点),27条边(消息),5个主题,1个可疑/阴谋主题,2个确定的罪犯,2个已知的清白者。而到目前为止,这个新的案件却已经有83个节点,400条边(有些不止涉及1个主题),超过21000个单词的消息记录,15个主题(其中3个已被视为是可疑的),7个已知的罪犯,和8个已知的清白者。这些数据在所附的电子表格文件:names.xls,Topics.xls,Messages.xls中给出。
names.xls包含办公室的关键节点对应的员工的名字。
topics.xls包含15个主题的代号及简短说明。
由于安全和隐私问题,你的团队不会有所有的直接消息记录。
messages.xls提供传输消息的节点对,和该消息的主题(可能不止一个主题,最多3个主题)。
为了使信息的沟通更加直观可视,图2提供了员工和消息链接的网络模型。
在这种情况下,不再像图1那样显示消息的主题。而是在文件Messages.xls里给出主题的数目,并在Topics.xls中给以描述。
要求:
要求1:到目前为止,已知Jean, Alex, Elsie, Paul, Ulf, Yao, and Harvey是罪犯,Darlene, Tran, Jia, Ellin, Gard, Chris, Paige, and Este不是罪犯。可以的消息主题是7,11和13。关于主题更多的信息在Topics.xls里。
建立模型和算法,把83个节点按照他是阴谋者的可能性大小排序,并解释你的模型和指标。Jerome, Delores, and Gretchen是该公司的高级经理。如果他们三个人中任何一个涉及阴谋
这将是非常有益的。
要求2:优先列表将有神秘变化,如果有新的信息告知我们说主题1也与阴谋有关,而且克里斯是一个阴谋?(即多了两个线索)
要求3:一个强大的与这个消息流通网络类似的获取和理解文本信息的技术被称为语义网络分析(semantic network analysis);作为人工智能和计算语言学的方法,它提供了一个结构,并可进行有关知识或语言的推理过程。另一个有关自然语言处理的计算语言学是文本分析text analysis。
针对我们的破案的情况,解释: 如果你能获得原始消息,那么对信息流量的上下文和内容进行语义和文字分析 对于 帮助你们的团队 开发出更好的模型和办公室人员的分类有多大的帮助和加强作用?
你有没有使用这些基于文件Topics.xls中的主题描述的功能来提高您的模型?
要求4:你的完整报告将最终提交给检察官办公室,所以一定要详细、明确地说明您的假设和方法,但不能超过20页。您可以包括你的程序作为单独的文件中的附件使你的论文不超过页面限制,但包括这些程序不是必须的。你的上司希望ICM是世界最好的解决白领、高科技的阴谋罪的机构,并希望您的方法有助于解决重要的世界各地的案件,特别是那些消息流量非常大的数据库(可能有数万的信息和数百万的单词)。她特别要求你在论文中讨论 :更深入的网络,语义,消息的文本分析内容是如何帮助你的模型和建议的。
作为给她的报告的一部分,请解释你用到的网络模型技术,以及为什么使用和它们可以怎么被用于任何类型的网络数据库从而来确定,优先级排序,和对相似结点分类的技术的网络模型,而不仅仅是犯罪阴谋和消息数据。比如,给你各种图像或化学数据,其中表明了感染概率和已经确定了的一些受感染的结点,你的方法能用来在生物网络中找到感染或患病的细胞吗?
2012 Contest Problems
MCM PROBLEMS
PROBLEM A: The Leaves of a Tree
"How much do the leaves on a tree weigh?" How might one estimate the actual weight of the leaves (or for that matter any other parts of the tree)? How might one classify leaves? Build a mathematical model to describe and classify leaves. Consider and answer the following:
?6?1 Why do leaves have the various shapes that they have?
?6?1 Do the shapes “minimize” overlapping individual shadows that are cast, so as to maximize exposure? Does the distribution of leaves within the “volume” of the tree and its branches effect the shape?
?6?1 Speaking of profiles, is leaf shape (general characteristics) related to tree profile/branching structure?
?6?1 How would you estimate the leaf mass of a tree? Is there a correlation between the leaf mass and the size characteristics of the tree (height, mass, volume defined by the profile)?
In addition to your one page summary sheet prepare a one page letter to an editor of a scientific journal outlining your key findings.
PROBLEM B: Camping along the Big Long River
Visitors to the Big Long River (225 miles) can enjoy scenic views and exciting white water rapids. The river is inaccessible to hikers, so the only way to enjoy it is to take a river trip that requires several days of camping. River trips all start at First Launch and exit the river at Final Exit, 225 miles downstream. Passengers take either oar- powered rubber rafts, which travel on average 4 mph or motorized boats, which travel on average 8 mph. The trips range from 6 to 18 nights of camping on the river, start to finish.. The government agency responsible for managing this river wants every trip to enjoy a wilderness experience, with minimal contact with other groups of boats on the river. Currently, X trips travel down the Big Long River each year during a six month period (the rest of the year it is too cold for river trips). There are Y camp sites on the Big Long River, distributed fairly uniformly throughout the river corridor. Given the rise in popularity of river rafting, the park managers have been asked to allow more trips to travel down the river. They want to determine how they might schedule an optimal mix of trips, of varying duration (measured in nights on the river) and propulsion (motor or oar) that will utilize the campsites in the best way possible. In other words, how many more boat trips could be added to the Big Long River’s rafting season? The river managers have hired you to advise them on ways in which to develop the best schedule and on ways in which to determine the carrying capacity of the river, remembering that no two sets of campers can occupy the same site at the same time. In addition to your one page summary sheet, prepare a one page memo to the managers of the river describing your key findings.
ICM PROBLEM
PROBLEM C: Modeling for Crime Busting
Click the title below to download a ZIP file containing the 2012 ICM Problem.
Your ICM submission should consist of a 1 page Summary Sheet and your solution cannot exceed 20 pages for a maximum of 21 pages.
Modeling for Crime Busting
A“多少钱,树上的叶子重?”你如何估计的实际重量的叶(或对任何其他部分的树)?你如何分类的叶子?建立一个数学模型,描述和分类的叶子。考虑并回答以下问题:
?6?1为什么叶片有各种形状,他们?
?6?1形状“最小化”重叠的个人投下阴影,以最大限度地暴露?分布是否叶片内的“量”的树和树枝的形状的影响?
?6?1讲的概况,是树叶的形状(一般特征)与树/分支结构?
?6?1你如何估计叶树?是否有关联之间的质量和大小特征树(高度,质量,数量界定的轮廓)?
除了你的一页表准备一一页信编辑科学杂志概述你的调查结果。
B
游客到大长河(225英里)可以享受风景和令人兴奋的白色水急流。河是无法进入的徒步旅行者,所以唯一享受它的方法是采取河之旅,需要几天的露营。河旅行都开始在第一次启动和退出河在最后退出,225英里下游。乘客乘橡皮艇桨驱动,而旅行的平均每小时4英里或摩托艇,平均每小时8英里的速度行驶。车次范围从6到18个晚上露营的河流,开始完成。政府机构负责管理这条河都要享受之旅荒野经验,以最少的接触与其他群体的小船在河。目前,×旅行旅行下来,大长江每年在一六个月期间(一年的其余太冷河旅行)。有你的营地在大长河,分布相当均匀在整个河流廊。鉴于流行起来的漂流,
游客到大长河(225英里)可以享受风光和令人兴奋的白色水急流。这条河是进不去的登山者,因此只能享用方式是采取一条河旅行,需要几天的露营。河在第一次发射开始旅行并退出的河流退出,下游225英里。乘客拿走一个橡胶浆-动力船只,平均4英里/小时或出差机帆船,平均8英里旅行。《与贸易有关的知识产权的范围从6到18夜晚的露营在河上,开始到结束。该政府机构负责管理这条河去享受希望每个一片荒野的经验,以最少的接触其他组的船只在河上。目前,X旅行沿着大长河每年在六个月期间(一年的其余部分的天气太冷河流旅行)。营地有Y在大长河中,公平的分布均匀整个河流廊道。上升的受欢迎程度给出漂流,公园管理者已经被要求允许更多的旅行到沿着这条河。他们想确定他们怎样可能安排一个最优的混合的旅行中,不同的时间(单位为夜河)和推进(马达或浆),将会利用最大限度的营地。换句话说,更多的乘船旅行可以被加到一个大的长河里的漂流的一个赛季吗?河里有雇你经理建议他们在发展所需要的方法和最佳排程方式来确定承载能力之河,记住没有两套露营者占据同一地点在同一时间内。除了你的一页简历页,准备一页备忘录,对经理人的河,描述你主要的发现。
有道的翻译
能理解
问题一:一棵树的叶片
“多少钱树的叶子有多重?”怎么可能估计的叶子(或树为此事的任何其他部分)的实际重量?会如何分类的叶子吗?建立了一个数学模型来描述和分类的叶子。考虑并回答下列问题:
•为什么叶片有,他们有各种形状?
•请勿形状的“最小化”个人投阴影重叠,以便最大限度地曝光吗?树叶树及其分支机构在“量”的分布效应的形状?
说起型材,叶形(一般特征)有关的文件树/分支结构?
你将如何估计树的叶质量?有叶的质量和树的大小特性(配置文件中定义的高度,质量,体积)之间的关系吗?
除了你一个页面的汇总表,准备一页纸的信中列出您的主要结果的一个科学杂志的编辑。
大隆河(225公里)的游客可以欣赏优美的景色和令人兴奋的白色水流湍急。这条河是无法去踏青,那么享受它的唯一途径是采取一河之旅,需要数天的露营。所有河流的旅行开始首次启动和退出在最后的出口,下游225英里的河流。乘客采取要么桨为动力的胶筏,平均4英里或机动船,其中8英里每小时平均旅行旅行。 TRIPS协定的范围从河上露营的6至18晚,开始到结束......政府机构,负责管理这条河要享受旷野的经验,与其他团体的河上的船最小的接触,每一个行程。目前,X人次前往大长江每年在六个月内(在今年余下时间,实在是太寒冷的河流人次)。有相当均匀地分布在整个河流廊道,大朗河Ÿ营地。鉴于漂流在河的知名度上升,公园管理人员已被要求让更多人次前往顺流而下。他们希望以确定它们如何可能的时间长短不一(在河上的晚来衡量)和推进器(马达或桨)在尽可能最好的方式,将利用该营地,安排行程的最佳组合。换句话说,有多少可以添加到更多乘船游览大朗河的漂流季节?河经理已经聘请你,向他们就如何在其中发展最好的时间表,并就如何在确定河流的承载能力,记住,没有两套营员们可以在同一时间占据同一站点。另外给你一个页面汇总表,准备一个页的备忘录描述你的主要结果的河流的管理者。