面试问题总结

2018-03-16 | 阅读：次

阿里 2018-04-09

阿里hr面

本来约了昨天面试哒，好像说面试官小哥哥昨天面了太多人了，没来得及面我T.T差点以为自己被刷了

自我介绍

聊了一个项目（全程都是我自己在说，算是项目介绍吧）

平时怎么学习的

有什么业余爱好

从之前的面试中有什么收获

以后想要从事什么方向的工作

有自己写过什么大型项目吗

阿里 2018-04-04

阿里云交叉面

主要还是围绕简历来问的，大叔给我提了很多中肯的建议

说我有的项目太学术化，想当然了

对很多知识点的理解太浅了，不够深入，自己不是特别擅长的东西就不要写在简历上面了

感觉自己还有好多东西要学哪~

阿里 2018-04-03

阿里云三面

CSRF防御，为什么在https跳转到http的时候不带referer？因为https要确保流量全程加密，所以在这种会被抓到包的细微之处也要做好。

三次握手，syn flood怎么防御。怎么设计UDP让其也有序传输。

sql注入怎么样防御

函数调用的汇编流程，一图胜千言吧…

看过什么书，怎么学习的

神经网络的padding，激活函数，过拟合，问的比较简单了

总体来说还是细节处需要加强，要做算法的话数学功底需要好，概率论和线代要看看，创造力有待培养和提升。

阿里 2018-04-02

阿里云二面，小哥哥的评价是总体还行，具体细节还需要加强。就算凉了我也是服气的，毕竟自己学的太粗浅了，很多分明知道的东西也不去深究

HTTP协议解析(是不是这个问题来着…)，反正就是要问burp抓到的包里面HTTP请求头有哪些

GET、POST、OPTION等请求方式的区别

XSS在输入检查还是输出编码处防御好

web指纹技术

session与cookie的区别

腾讯 2018-04-02

腾讯teg的安全云二面，之前那个部门就是挂了啊

问了我我如何识别垃圾短信

国民经济平均值报表发出来，大家都说自己达不到平均收入，如何看待

了解正态分布吗

鱼妹说我这种面了三个部门的只此一家了，现在总共加起来腾讯有7面了，估计也是凉凉了🤣

腾讯 2018-03-30

腾讯四面，还是技术面，让我介绍项目

最后问了我一个月有31天的话，第二个周三可能是第几天，我回答得太惨了，可能是挂了吧🤣🤣🤣🤣🤣

鹅厂的面试基本贯穿了我这个月的面试流程，挂了的话是不是可以4月5号笔试之后再面一波🤣🤣🤣🤣🤣

段少说我可以到时候写个帖子，说鹅厂面了我10面，最后把我给刷了😤😤😤😤😤

阿里 2018-03-29

下午内推了阿里云盾，当天晚上接到面试电话，面完了才知道面试官是帮我内推的小哥哥🤣

主要是根据简历来问的，就是想要看里面写的项目是不是真的是自己做的。

有个问题是问我知不知道语料库如何采集，可能是有什么官方的方法吗，我得查查资料。

我项目里面的一些代码是直接copy人家git上面的源码，觉得能实现功能就好了，也没深究代码的意义，然后被问得很虚。

另外我觉得如果想要进某个部门的话，就必须深入了解这个部门的产品线。我可能最近没事就打开云盾主页，看他们家的产品介绍🤣，所以这个小哥哥对我这点还是很满意的

另外会问优缺点啥的，稍微准备下就好

腾讯 2018-03-29

三面是两个大叔，就跟一个大叔聊着聊着，突然又有一个大叔在问我问题，吓哭我😂

第一个大叔主要还是围绕简历来问，蜜饵文档的制作，我可能还需要回去看看代码了。

函数怎么压栈，爬虫的多线程代理池自己写过没，用户访问网站会发生什么交互（这边我直接讲了https的握手过程…）

shell脚本我还需要学习下

第二个大叔问了我很多深度学习相关的东西，介绍下项目用的模型，然后说我基础不错😊

腾讯 2018-03-26

TEG部门小哥哥二面，这个小哥哥好温柔

技术问题如下：

+ SSRF
+ memcache的drDoS如何防御：
    + memcache使用者：升级最新版本，监听端口随机，将服务放置于可信域内，添加安全组,查看set命令后value的大小是否超过阈值，过滤对外发送的虚假ip报文
    + 被攻击方：流量清洗（how？？？）[互联网创业公司如何防御 DDoS 攻击？](https://www.zhihu.com/question/19581905)
+ 如何审计网站上面的sql注入
+ 如何绕过waf
+ windows保护机制除了GS、ASLR、DEP还有什么，有零页禁用、高熵随机化、[执行流保护（Control Flow Guard , CFG）](http://www.freebuf.com/articles/security-management/58373.html)、管理模式执行保护（Superior Mode Execution Prevention, SMEP）等等。
    [windows安全机制](https://blog.csdn.net/moshangyanyuyao/article/details/17320715)
+ 卷积的原理，为什么高效

其他就是很多安全学习的问题，为什么要做安全，自己有什么优点（这个我得好好想想，夸夸自己啊），以后的职业规划什么的。

腾讯 2018-03-22

TEG部门的小哥哥，问的都是我简历上面的东西，但是想要深入问下去我就都不会了

最近准备分析个office的宏病毒

做几个waf绕过的实验

腾讯二面 2018-03-20

好像被分到支付反欺诈的部门了…小哥哥一直在问机器学习相关的东西…

搜了下支付安全，没有搜到很多技术文，从支付宝安全漏洞开始，谈谈机器学习与业务规则，再八卦下人工智能:

我们来做一个模型，来判断一下当前这个想登录支付宝的用户是不是账号的本人。那么特征工程怎么做呢？考虑的并非仅仅是用户通过了几个安全问题的回答（这个仅仅是实时特征），还有用户基础属性和长期积累的行为。

先不说用户能通过哪几个安全问题，仅仅从用户基础属性和长期行为观察，都可以推测出用户被盗的风险。

举个简单的例子，文化水平低的用户账号容易被盗，在淘宝上经常购买XX商品的用户账号容易被盗，经常在外面开房的用户账号容易被盗等等。

于是乎，提取一堆离线特征，性别，文化水平，区域，购物偏好，酒店订单次数等等.

训练样本也是有的，用户投诉反馈被盗的用户作为正样本，随机挑一些其他用户作为负样本.

然后开始上机器学习算法，贝叶斯，决策树，逻辑回归，gbdt等等，挑挑参，看看ROC和AUC，选择一个最好的上线。

听说做风控的要求变量的可解释性，因此会做一些特征选择方面的工作，比如相关性过高的特征只保留一个。

于是，线上的安全策略模型就是通过账号被盗风险+实时特征（当前网络环境和通过的安全问题）来判断当前用户是账号本人。

比如你的账号被盗风险是0.3，在之前的WIFI下登录，通过了2个安全问题，那么你很可能通过了。

再比如你的账号被盗风险是0.9，在一个全新的WIFI下登录，也许你连回答安全问题的资格都没有。所以，并不是所有人都可以绕过手机验证码，通过回答安全问题进行密码修改的。

得把机器学习相关的基础知识点好好看看，一个机器学习的具体过程是什么，如何选模型

审计规则怎么定

基础算法还是得看看啊，快排什么的

态势感知到底在做什么

自己到底擅长什么

腾讯 2018-03-16

听完段博士的中期答辩，回到实验室就接到一面电话，还好没回宿舍睡午觉哪…

总体来说，我感觉自己对很多问题的理解都太浅了，稍微有点深入我就die了，还是得把每个问题扣细了看哪~

然后虽然我投的是安全岗，但是一些编程相关的基础知识还是得看的。

1.学过哪些跟安全相关的课程，印象最深的是什么课程，课程里面印象最深的是什么？

我答了计算机网络，怕其他课程会踩坑，然后讲了DNS的解析过程，DNS劫持、DNS污染。然后问了DNS劫持和污染不都是劫持吗，怎么去劫持？（我可能是答错了，不仔细看原理的后果很严重

DNS劫持：劫持了DNS服务器，通过某些手段取得某域名的解析记录控制权限，进而修改此域名的解析结果，导致对该域名的访问由原IP地址转入到修改后的指定IP。解决:使用国外免费公用的DNS服务器，如8.8.8.8
DNS污染：让一般用户由于得到虚假目标主机IP而不能与其通信的方法，是一种DNS缓存投毒攻击，一旦发现与关键词相匹配的请求则立即伪装成目标域名的解析服务器给查询者返回虚假结果，直接在协议上对用户的DNS请求进行干扰。解决:使用VPN

2.XSS是在前端执行的，虽然有存储型XSS，但是还是在前端被X啊。会产生哪些影响：cookie劫持、后台增删改文章、钓鱼（利用xss构造出一个登录框，骗取用户账户密码）、xss蠕虫（利用xss漏洞进行传播）、修改网页代码（必须存在存储型xss漏洞，并且将结果返回到页面上）、利用网站重定向、获取用户信息（如浏览器信息，IP地址等）。

3.CSRF的过程，会读数据吗？CSRF可以读数据，如2007年的Gmail CSRF漏洞，邮箱的Filter中会新创建一条规则，将所有带附件的邮件都转发到攻击者的邮箱中。

token除了可以放在post包里面，还可以放在那里？用户的Session中，或者浏览器的cookie中。

4.堡垒机是干什么的？（自己给自己挖的坑吧）运维堡垒主机是种具备强大防御功能和安全审计功能的服务器。基于跳板机理念，作为内外网络的个安全审计监测点，以达到把所有网站安全问题集中到某台服务器上解决，从而省时省力。同时运维堡垒主机还具备了，对运维人员的远程登录进行集中管理的功能作用。

5.python的多线程、多进程,可能我还是需要把我辣鸡的小爬虫做成多线程的看看，回答起来才更有底气啊。

背景：
- GIL(Global Interpreter Lock):全局解释器锁
- 每个CPU在同一时间只能执行一个线程
多线程执行方式：
- 获取GIL
- 执行代码知道sleep或者是python虚拟机将其挂起
- 释放GIL
在Python2.x里，GIL的释放逻辑是当前线程遇见IO操作或者ticks计数达到100，而每次释放GIL锁，线程进行锁竞争、切换线程，会消耗资源
是否多线程无用？
- CPU密集型代码（循环、计数等），由于计算工作多，ticks计数很快就会达到阈值，然后触发GIL的释放与再竞争（多个线程来回切换当然是需要消耗资源的），所以python下的多线程对CPU密集型代码并不友好!!!!!!!!。
- IO密集型代码（文件处理、爬虫等），多线程能够有效提升效率(单线程下有IO操作会进行IO等待，造成不必要的时间浪费，而开启多线程能在线程A等待时，自动切换到线程B，可以不浪费CPU的资源，从而能提升程序执行效率)。所以python的多线程对IO密集型代码比较友好。
多核多线程比单核多线程更差，原因是单核下多线程，每次释放GIL，唤醒的那个线程都能获取到GIL锁，所以能够无缝执行，但多核下，CPU0释放GIL后，其他CPU上的线程都会进行竞争，但GIL可能会马上又被CPU0拿到，导致其他几个CPU上被唤醒后的线程会醒着等待到切换时间后又进入待调度状态，这样会造成线程颠簸(thrashing)，导致效率更低
python下想要充分利用多核CPU，就用多进程,每个进程有各自独立的GIL，互不干扰，这样就可以真正意义上的并行执行，所以在python中，多进程的执行效率优于多线程(仅仅针对多核CPU而言)。

6.DrDDoS为什么能放大5w倍： Memcached的key-value功能。前文提到key-value的作用是决定存储容量的大小，正常情况下key-value的值通常不超过几千字节。当Memcached被攻击者利用作为反射器时，key-value的值经过修改可以达到100万字节以上。

http://www.freebuf.com/vuls/164864.html

7.C++ 为什么能继承（这个我再想想，可能我是把问题听错了）

8.windows防御机制，哪个是第一个出现的？ASLR、DEP、GS

9.Java反序列化，这个我要去具体分析几个poc了，要不然说起来真是没底气啊

10.平时会看书吗？我说了在看兜哥的《web安全深度学习实战》，问我具体的章节问题，里面的demo我都还没试啊，懒惰如我…

Snowty

筱筱汀的碎碎念