小编:在昨日分享的文章中,我们用deepseek官网模型尝试对一张图片进行了测试,详情见这里:和Deepseek做PK,在一张土地覆盖数据图上你能看出些什么内容?。但是文章发布后我们立刻发现两个问题:
1、deepseek官网其实是没有开通多模态的,他只是简单的ocr即识别了图中的文字。(佐证:当在官网给出一张无文字图片时,会提示仅识别附件中的文字,然后提示未提取到文字)
2、那图片解读的内容是哪里来的呢?好家伙,是deepseek通过识别图名、图例、备注然后编造出来的。果然厉害,特别像真实的。
那么是不是deepseek就没有多模态呢?肯定不会,deepseek不仅有图像模型,而且是生图与识图结合的模型,并且也将这个叫做janus-pro的模型进行了开源。但没有在官网开通。
我们拿到deepseek图像模型后进行了测试,完全使用模型本身的能力,不增加过于复杂的提示词、背景提示,我们给他了一张街景图片,仅仅让他评价,结果出乎我们的意料。
我们可以看看对应的图片以及deepseek模型的回答。
百度街景读图返回JSON

本轮测试图片:百度街景图
由于是多模态模型,所以我们可以直接要求他返回街景评价并使用json格式,便于我们进行后续数据处理。
返回内容:
{“street_design_evaluation”: {
“overall_impression”: “该街景设计整体上显得较为现代化,但存在一些需要改进的地方。”,
“street_layout”: “街道布局较为合理,但人行道和非机动车道之间的分隔不够明确,可能存在安全隐患。”,
“traffic_management”: “交通信号灯和路标清晰可见,但停车秩序有待优化,路边停放的电动车和摩托车较多,可能影响行人通行。”,
“tree_planting”: “街道两旁种植了树木,为行人提供了遮阴,但部分树木的枝叶遮挡了视线,影响交通信号灯的可见性。”,
“building_design”: “建筑设计较为统一,但部分建筑外墙的广告牌和空调外机显得杂乱,影响美观。”,
“public_facilities”: “街道两侧的公共设施如垃圾桶和座椅较为齐全,但部分设施可能存在破损或清洁维护不足的问题。”,
“pedestrian_comfort”: “人行道宽敞,但部分区域可能存在盲道不清晰或被占用的情况,影响行人安全。”,
“environmental_considerations”: “街道绿化较好,但部分区域可能存在扬尘问题,建议增加洒水降尘措施。”,
“improvement_suggestions”: [
“优化停车秩序,增加停车引导标识。”,
“加强公共设施的维护和清洁。”,
“优化交通信号灯和路标设计,确保行人安全。”,
“增加更多绿化区域,提升整体环境质量。”,
“加强建筑外墙的整洁和美观设计。”
]
}
}
大家可以看出,返回的数据里面,他的键名非常的有意思,似乎内设了很多个评价角度,总结如下:

我们换了一张图,让他更详细的评价街景,他又给我们返回了一个json内容,忘记是用的是哪张图了,只保留了结果:

整理下这次他的评价维度:

让人惊喜的两点
通过上面的测试,让人惊喜的有两点:
1、deepseek图像模型直接识别的街景图片还是相对靠谱的,内容上细节也能够识别到了。
2、简单的让他评价和提出改善建议,返回json,他竟然对json的字段名选择的非常靠谱,全部是自动完成的
最重要的,这个json里面字典的名称,给我们了一些启发,因为这里面的键名其实反映了deepseek对图片的评价标准,大家看这些是不是很像是不同的评价方向。按照这个逻辑,可以对各类图片进行深挖,看看他里面内置了多少“评价字段”,或许会给我们一些启发。
预设维度让deepseek评价

本轮测试图:元技能AI生成的建筑概念图
这次我们给出一张图,让他指出如何改造。我们这次不要求json输出,要求他直接给我们建议,最关键的是,我们可以借鉴上文中的键名,直接规定他的评价维度,比如直接要求他对建筑设计风格、立面设计、绿化景观、交通设施,四个方面评价,返回内容如下:
这个城市的街景设计整体上非常现代化,具有以下特点:
1. 建筑设计风格:
建筑设计风格偏向现代和未来感,尤其是图片中展示的建筑物,其独特的球形结构和圆形窗户设计,给人一种科技感和创新感。
建筑立面采用了大量的玻璃幕墙,不仅增加了建筑的通透感,还提升了采光效果。
2. 立面设计:
立面设计简洁而富有层次感,球形建筑的顶部和底部都采用了圆弧形设计,与周围直线型的建筑形成对比,增加了视觉上的趣味性。
建筑底部有明显的标识牌,清晰地展示了建筑用途和品牌信息,有助于提升辨识度。
3. 绿化景观:
街景中可以看到一些绿化景观,例如左侧的棕榈树和右侧的植被,这些植物为城市增添了自然气息,缓解了现代建筑的冷硬感。
虽然绿化面积有限,但这些植物的布置显得非常精致,与建筑风格相得益彰。
4. 交通设施:
图片中可以看到街道宽敞,交通设施完善,包括人行道、机动车道和自行车道。
街道两旁有路灯和交通标志,确保了行人和车辆的安全。
需要提升的地方:
绿化覆盖率可以进一步提高,以增加城市的生态友好性。
在交通设施方面,可以考虑增加更多的公共交通设施,如地铁站或公交车站,以减少对私家车的依赖。
在建筑设计中,可以更多地融入本地文化元素,使建筑更具地域特色。
总体而言,这个城市的街景设计在现代化和功能性方面表现出色,但可以通过进一步优化绿化和交通设施来提升整体宜居性和可持续性。
尝试建筑改造建议
接下来我们再次测试直接给出建筑的优缺点和一些改造建议,返回内容如下:

本轮测试图:元技能AI生成的建筑概念图
这个建筑以其独特的现代设计风格吸引眼球,但也有一些可能的缺点和改进建议:
1. 与自然环境的融合度:
优点:建筑周围有绿植和树木,与自然环境和谐共存。
缺点:建筑的曲线和几何形状可能显得过于突兀,与自然景观的柔和线条形成对比。
改进建议:可以考虑增加更多曲线和自然元素,如使用曲线形状的植被或模仿自然形态的装饰,使建筑与周围环境更加融合。
2. 采光和通风:
优点:建筑的玻璃窗设计提供了良好的采光效果。
缺点:大面积的玻璃窗可能使室内温度难以控制,尤其是在夏季。
改进建议:可以考虑增加遮阳装置或使用低辐射玻璃,以减少热量吸收,同时保持良好的采光效果。
3. 景观设计与建筑的互动:
优点:建筑周围有精心设计的景观,增加了视觉吸引力。
缺点:景观设计可能与建筑风格不完全一致,缺乏整体性。
改进建议:可以考虑将景观设计与建筑风格统一起来,例如使用相同的颜色或材料,使整个区域看起来更加和谐。
4. 功能性:
优点:建筑内部可能具有现代化的功能设计。
缺点:从图片中无法确定建筑内部的功能,可能存在设计上的不足。
改进建议:可以考虑增加更多关于建筑内部功能的细节,如展示内部设计、功能区划等,以更好地理解其用途。
5. 安全性:
优点:建筑外观现代且美观。
缺点:建筑的曲线和复杂结构可能增加安全隐患。
改进建议:可以考虑增加更多的安全措施,如使用更坚固的材料、增加护栏等,以确保使用者的安全。
通过这些改进建议,可以更好地平衡建筑的美观与实用性,使其与周围环境更加和谐,同时满足使用者的需求。
老城区照片测试

本轮测试图:百度街景图片
这次尝试引导他做一些保护方面的思考,并且要求简短。返回如下:
这个建筑与景观设计在保留历史风貌的同时,也存在一些缺点。首先,建筑外墙的涂漆已经剥落,显得有些破旧,这可能影响整体美观。其次,入口处的装饰线条设计虽然具有一定的艺术感,但与周围环境稍显不协调。此外,街道上缺乏绿化和景观设计,使得整体环境显得单调。
改进建议如下:
1. 外墙修复与翻新:可以对建筑外墙进行重新粉刷,选择与周围环境相协调的颜色,以提升整体视觉效果。
2. 入口装饰优化:可以对入口处的装饰线条进行重新设计,使其更加符合现代审美,同时保留历史特色。
3. 增加绿化与景观设计:在建筑周围增加绿植和景观设计,如种植树木、设置花坛或小型喷泉,以提升整体环境质量。
4. 街道改造:可以对街道进行重新规划,增加人行道、自行车道和公共座椅,为居民和游客提供更舒适的步行体验。
5. 引入人性化设计:在入口区域设置无障碍通道,方便残障人士使用。
通过这些改进,可以更好地保护和传承历史风貌,同时提升整体环境质量,为居民和游客提供更美好的生活体验。
总结
经过测试,deepseek图像模型的准确度还是比较高的,虽然还是有各种问题,但原因很可能是提示词不够精准,缺乏对这个地区的预先的背景介绍等,需要进一步细化研究。
上面的测试仅仅是多模态模型的一个一次性回复的答案。如果加上deepseek语言模型的预设、定量指标的导入、现状的补充说明等,多轮对话会有非常大的想象空间。
另外,既然能够评价街景,那么对于图片中物体的识别、判断,甚至分类,也可以做出一个相对可用的解读,这对于低成本处理大量现状图片,或者融入到工作流中是非常有意义的。
当然上面仅仅是一个简单的案例,但是通过这个案例,真的是能够形成一个完整的研究链条。从数据的采集、图片的分析、文本的整合,最后达成最终的结论。
已部署,一起试试看
目前这个模型已经整合到了国匠城微信公众号,推荐大家把公众号设为星标便于找到。
直接给公众号发一张照片,他就会返回改造建议与评价:

国匠城微信公众号回复示意

在一些对数据精准度要求不是很高,同时强调感性的设计层面,这个模型是有很大的用处的。例如还可以根据区域内道路进行评价汇总,给出区域道路的整体质量、安全、感受等评价,在一些轻量级的应用上完全没问题。
以上为非常初级的测试,内容仅供参考。
更多思考
对于城市设计工作来说,未来可能需要继续整理标签体系,挖掘大模型的内涵标签,规范提示词系统,甚至针对性的微调大模型,还有很多可探索的内容。
最近在一篇文章中看到,对于AI:
平庸作者会被淘汰,但顶尖作者将获得更高溢价——因为当AI能生产90%内容时,剩下10%的人类智慧会变得更稀缺和昂贵。

图片来自湃动商业评论
《这是一篇DeepSeek写的商业文章,请问人类输了吗?》
城市设计和法定规划领域不同,更加需要原创与创意思想、复杂价值判断、人性化叙事,而对于AI陷阱的检验、搭建认知框架、思想冲突的实验,也都是很现实的内容,由此来看,AI在城市设计的应用值得继续深入挖掘。
相关阅读:
已应用的小程序推荐:
以下是广告
祝大家2025财源滚滚,身体健康,一帆风顺。
首先是知识星球的广告,每日分享,共同进步,目前同步开通网站权限,网址:http://gui-hua.com
然后是课程广告,如果希望掌握AI工具,欢迎加入元技能AI的课程(优惠继续进行中),点击图片查看详情。
原文始发于微信公众号(国匠城):Deepseek图像模型做街景评价与改造建议——在城市设计中的应用可能